人工知能(AI)、ビッグデータ法務 著作権
2023年12月20日文化庁「AIと著作権に関する考え方について(素案)」についての考察(1)
Contents
1 はじめに
2023年12月20日に文化審議会著作権分科会法制度小委員会(第5回)が開催され、そこで文化庁が「AIと著作権に関する考え方について(素案)」を公表しました(以下「素案」といいます。)
本記事では、素案のうち、まずは「(1) 学習・開発段階」について、私なりに検討をしたいと思います。
なお、2024年1月15日に文化審議会著作権分科会法制度小委員会(第5回)が開催され、そこでさらにバージョンアップされた素案が公表されますので、本記事はそれまでの暫定的な検討ということになります。
ということで、短命な?記事ですが、早めに公開することにも意味があるだろうと思い、公開します。
以下、素案を適宜分割し、引用した上で当該引用部分についてのコメントを記載していきます。また、適宜見出しを付けていきます。
2 素案についての考察
(1) 導入部分
AIと著作権に関する考え方について(素案)
※本資料は、公開時点において議論・検討中であるAIと著作権に関する論点整理の項目立て及び記載内容案の概要を示すものであり、今後の議論を踏まえて変更される可能性がある。1.はじめに (略)
2.検討の前提として
○ AIと著作権の問題を考えるにあたっては、既存の著作権法の考え方との整合性を考慮した上で検討することが必要であり、特に、AIについての議論が、人がAIを使わずに行う創作活動についての考え方と矛盾しないように留意する必要がある。そのため、特に以下の点については、AIと著作権について検討する前提として確認することとする。
① 著作権法で保護される著作物の範囲(著作権法第2条第1項第1号(以下、著作権法の各条文に言及する場合には、「法第〇条」という。)の定義)
② 著作権法で保護される利益
③ 権利制限規定の考え方(保護と利用・新たな創作の自由とのバランス)
④ 日本の著作権法が適用される範囲(生成AIの学習・開発及び生成・利用の各段階についての考え方)
このうち「2 ② 著作権法で保護される利益」の部分は議論のスタート地点として非常に重要です。
30条の4は2018年の著作権法改正で導入された条文ですが、後述のように「情報解析」のような非享受利用が「著作権法で保護される著作権者の利益」を通常は害しないことを前提としています。
そこでいう著作権法で保護される著作権者の利益とは、「著作権者が受ける可能性のあるあらゆる利益」を意味している訳ではありません。
著作権法で保護される著作権者の利益とは、具体的には「視聴者が著作物に表現された思想又は感情を享受することによる知的又は精神的欲求の充足という効用の獲得を期待して,著作物の視聴のために支払う対価」(2018年改正の基礎となった平成29年4月文化審議会著作権分科会報告書P41参照)であり、それ以外の利益を指すものではありません。
そして、著作権法は、「著作物の利用行為」のうち、ある一定の行為(法定利用行為、「複製」「公衆送信」等)について著作権者に独占権を付与することにより、この著作権者の利益(著作権法で保護される利益)を著作権者が確保できるようにしています。
そのため、著作物の利用によって、上記したような「著作権法で保護される著作者の利益」以外の「利益」が仮に侵害されるとしても、そもそもそのような利益は著作権法で保護されていないので、それは著作権法の問題ではないということになります。
○ AIと著作権の関係において、特に法第30条の4を中心に、以下の点を踏まえた議論が必要であり、確認することとする。
① 制定に至る背景と経緯
② 対象となる利用行為(AIに限定したものではないことの確認)
③ 非享受目的の理解(情報解析について・他の目的が併存する場合について)
④ 権利制限規定は技術的対応による学習回避を否定するものではないこと
de-
3.生成AIの技術的な背景について (略)4.関係者からの様々な懸念の声について (略)
このうち「④ 権利制限規定は技術的対応による学習回避を否定するものではないこと」がちょっと判りにくいのですが、要するに「権利制限規定があるからといって、権利者が技術的対応によって、AI学習のための複製を回避することが否定・禁止されるものではない」ということでしょう(素案(1)エ(エ)(P7)にも同趣旨の記載があります)。
そうであれば、それは当然のことだと思います。
問題は、そのような技術的な学習回避措置がなされた場合において、当該回避措置をさらに回避して行われる学習行為及び学習のための著作物利用行為の扱いです。
後述するように、素案は一定の場合において、技術的な学習回避措置を回避して行われる学習行為等について、法30条の4ただし書に該当する可能性があるとしています(その点について個人的に強い疑問を持っていますが、詳細は後述します)。
なお、著作権法上は、技術的な著作物利用回避措置のうち「技術的保護手段」(法2条1項20号)、「技術的利用制限手段」(法2条1項21号)について特別の効果を与えています。
つまり、① それら「技術的保護手段」「技術的利用制限手段」に該当する回避措置を回避して行われる行為については、権利制限規定が適用されないとしたり(法30条1項2号)、②「技術的利用制限手段」や「技術的保護手段」の回避行為をみなし侵害行為(法113条6項、7項)として扱ったり、③「技術的保護手段」「技術的利用制限手段」の回避を行う機能を有する装置・プログラムの譲渡についての刑事罰(法120条の2第1号)が課される、としています。
もっとも、これはあくまで、当該技術的回避措置が、著作権法上の「技術的保護手段」(法2条1項20号)、「技術的利用制限手段」(法2条1項21号)に該当した場合だけに与えられる特別な効果であり、あらゆる技術的な回避措置について、このような特別の効果があるわけではありません。
(2)個別論点について
5.各論点について
○ 著作権法の基本的な考え方と技術的な背景を踏まえ、生成AIに関する懸念点について、以下のとおり論点が整理できるのではないか。〔 〕内は骨子案の項目との対応関係(1)学習・開発段階
ア 検討の前提〔骨子案:(1)ア〕
(ア)平成30年改正の趣旨
○ 近時のAI開発においては、著作物を含む大量のデータを用いた深層学習等の手法が広く用いられており、この学習用データの収集・加工等の場面において、既存の著作物の利用が生じ得る。こうした AI開発のための学習を含む、情報解析の用に供するための著作物の利用に関しては、法第30条の4において権利制限規定が設けられている(同条第2号)。○ 同条を含む「柔軟な権利制限規定」を創設した平成30年改正の趣旨としては、技術革新により大量の情報を収集し、利用することが可能となる中で、イノベーション創出等の促進に資するものとして、著作物の市場に大きな影響を与えないものについて個々の許諾を不要とすることがあったといえる(文化庁著作権課「デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方(著作権法第30条の4,第47条の4及び第47条の5関係)」(令和元年10月24日)(以下「基本的な考え方」という。)1頁) 。
○ また、法第30条の4 は、このような「柔軟な権利制限規定」 の中でも特に、著作権者の利益を通常害しないといえる場合を対象とするものである(「基本的な考え方」6頁) 。
○ そのため、同条の要件を解釈するに当たっては、このような平成30年改正の趣旨や、同条の規定の趣旨を踏まえて解釈する必要がある。
特に異議・違和感はありません。
なお、上記「基本的な考え方」は、2018年の著作権法改正時に作成・公表された資料ですが、それ以降のAIの爆発的な技術的発展にも関わらず、AIと著作権に関する全ての議論の礎になっています。
これは凄いことだと思います。
(イ)議論の背景
○ 近時の生成AI技術の進展は著しく、また、その普及は事業者にとどまらず一般市民の間にも広く進んでいる。このような状況の中で、法第30条の4の適用範囲等の、同条の解釈が具体的に問われる場面も増加していることから、現時点では、特に生成AIに関する同条の適用範囲等について、再整理を図ることが必要である。
○ この点に関して、法第30条の4は生成AIのみならず、技術革新に伴う著作物の新たな利用態様に柔軟に対応できる権利制限規定として設けられたものであり、例えば、生成AI以外のAI(認識、識別、人の判断支援等を行うAI)を開発する学習のための著作物の利用、技術開発・実用化試験のための著作物の利用、プログラムのリバース・エンジニアリング等の行為も権利制限の対象とするものである。
○ そのため、再整理を行うに当たっては、上記のように様々な技術革新に伴う著作物の新たな利用態様が不測の悪影響を受けないよう留意しつつ、生成AI特有の事情について議論することが必要である。
2018年の30条の4制定段階でも、すでに生成AIによる著作権侵害が発生することは十分想定されていました(詳細はこの記事ご参照)が、それはともかく、法第30条の4が生成AI特有の条文ではないことは素案の言うとおりです。
素案が挙げている例のうち「生成AI以外のAI(認識、識別、人の判断支援等を行うAI)を開発する学習のための著作物の利用」については同2号「情報解析の用に供する場合」に、「技術開発・実用化試験のための著作物の利用」は同1号「著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合」に、「プログラムのリバース・エンジニアリング等の行為」は、同条柱書「当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合」(基本的な考え方問12)にそれぞれ該当しますので、当該行為に際しては、原則として著作権者の許諾は不要です。
素案がここで言いたいのは、要するに「生成AIは確かにインパクトは大きいが、それに引きづられすぎた著作権法の解釈を行うことで、それ以外の技術革新に悪影響を与えないようにする必要がある」ということですが、至極当然のことだと思います。
(3) 「情報解析の用に供する場合」と享受目的が併存する場合について
【 「非享受目的」に該当する場合について】
イ 「情報解析の用に供する場合」と享受目的が併存する場合について〔骨子案:(1)イ、キ〕
(ア)「情報解析の用に供する場合」の位置づけについて
○ 法第30条の4柱書では、「次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には」と規定し、その上で、第2号において「情報解析(……)の用に供する場合」を挙げている。○ そのため、AI学習のために行われるものを含め、情報解析の用に供する場合は、法第30条の4に規定する「当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合」に該当すると考えられる。
ここも当然のことだと思います。
ちなみに条文上は「次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には」と定められています。
「その他」ではなく「その他の」という規定ですが、このように、法令の条文で「その他の」とある場合は「その他の」の前にある名詞が、「その他の」の後にある、より意味内容の広い名詞の例示としてその中に包含される場合に用いられます。
つまり、30条の4第1号、第2号、第3号は、「当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合」の例示ということになります。
(イ)非享受目的と享受目的が併存する場合について
○ 他方で、一個の利用行為には複数の目的が併存する場合もあり得るところ、法第30条の4は、「当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には」と規定していることから、この複数の目的の内にひとつでも「享受」の目的が含まれていれば、同条の要件を欠くこととなる(脚注1)。▼ 脚注1
1 なお、法第30条の4に規定する「享受」の対象について、同条では上記のとおり「当該著作物」と規定していることから、表現された思想又は感情の享受目的の有無が問題となるのは、同条による権利制限の対象となる当該著作物(例:AI学習のため複製等される学習用データ)についてであり、これ以外の他の著作物について享受目的の有無が問題となるものではない。そのため、例えば、AI学習を行う者が、生成AIによる生成物を観賞して楽しむ等の目的を有していたとしても、これによって開発・学習段階における法第30条の4の適用が否定されるものではないと考えられる。○ そのため、ある利用行為が、情報解析の用に供する場合等の非享受目的で行われる場合であっても、この非享受目的と併存して、享受目的があると評価される場合は、法第30条の4は適用されない(脚注2)。
▼ 脚注
2 この点に関しては、事業者が侵害物の生成を抑止するための技術的手段を講じている場合、事業者の行うAI学習のための複製が、非享受目的であることを推認させる事情となる、といった意見があった。
情報解析目的と享受目的が併存している場合のように、「非享受目的と享受目的が併存する場合」には30条の4が適用されないことを明確に示しています。
この点については反対説もあります(「情報解析目的があれば、享受目的が併存していても30条の4の適用はある」とするもの)が、立法趣旨(「基本的な考え方」P8参照)や条文の規定ぶりからすると、素案の示しているように、「非享受目的と享受目的が併存する場合」には30条の4が適用されないと考えます1ちなみに、「基本的な考え方」P8が示している「非享受目的と享受目的が併存する場合」の例は「家電量販店等においてテレビの画質の差を比較できるよう市販のブルーレイディスクの映像を常時流す行為(上映)」「漫画の作画技術を身につけさせることを目的として,民間のカルチャー教室等で手本とすべき著名な漫画を複製して受講者に参考とさせるために配布する行為等」です。。
ちなみに脚注1には「例えば、AI学習を行う者が、生成AIによる生成物を観賞して楽しむ等の目的を有していたとしても、これによって開発・学習段階における法第30条の4の適用が否定されるものではないと考えられる」とありますが、これは「AI学習を行う者が、生成AIにより生成された、学習対象著作物と類似しない生成物を観賞して楽しむ等の目的を」という意味なのでしょうね。
○ 生成AIに関して、享受目的が併存すると評価される場合について、具体的には以下のような場合が想定される。
・ ファインチューニングのうち、意図的に、学習データをそのまま出力させることを目的としたものを行うため、著作物の複製等を行う場合。
(例)いわゆる「過学習」(overfitting)を意図的に行う場合
生成AIの学習段階における著作物利用行為を行うに際して、どのような場合に享受目的併存と評価されるかを述べた部分であり、非常に重要です。
これまで文化庁がこの点について見解を示したのは、「基本的な考え方」問15と「AIと著作権の関係等について」の資料ではないかと思います(ただし、「基本的な考え方」問15の方は学習段階の話なのか、生成・利用段階の話なのかちょっとはっきりしません)。
「AIと著作権の関係等について」(下記資料です)では、「例えば、3DCG映像作成のため風景写真から必要な情報を抽出する場合であって、元の風景写真の「表現上の本質的な特徴」を感じ取れるような映像の作成を目的として行う場合は、元の風景写真を享受することも目的に含まれていると考えられることから、このような情報抽出のために著作物を利用する行為は、本条の対象とならないと考えられる」という記載があります(赤枠部分は柿沼加筆)。
この記載を一般化すると、生成AIの学習段階における「享受目的が併存している場合」とは、「生成AIの学習段階における著作物利用行為を行うに際して、当該生成AIを用いて学習対象著作物の「表現上の本質的な特徴」を感じ取れるようなAI生成物の作成を目的として行う場合」ということになるでしょう。
そして、素案が例として示す「ファインチューニングのうち、意図的に、学習データをそのまま出力させることを目的としたものを行うため、著作物の複製等を行う場合。」は、まさにこの享受目的併存に該当します。
AI学習のために用いた学習データを出力させる意図は有していないが、既存のデータベースやWeb上に掲載されたデータの全部又は一部を、生成AIを用いて出力させることを目的として、著作物の内容をベクトルに変換したデータベースを作成する等の、著作物の複製等を行う場合。
(例)以下のような検索拡張生成(RAG)のうち、生成に際して著作物の一部を出力させることを目的としたもの(なお、RAGについては後掲(1)ウも参照)
インターネット検索エンジンであって、単語や文章の形で入力された検索クエリをもとにインターネット上の情報を検索し、その結果をもとに文章の形で回答を生成するもの
企業・団体等が、単語や文章の形で入力された検索クエリをもとに企業・団体等の内部で蓄積されたデータを検索できるシステムを構築し、当該システムが、検索の結果をもとに文章の形で回答を生成するもの
ちょっと判りにくいですが、RAGが例としてあげられていることからすると、既存著作物を学習(AIモデル内のパラメータの物理的な更新)に用いる場合ではなく、既存著作物を生成AIに入力してAI生成物を生成する場面の説明のように思います。
ちなみに、RAGとは一般的には以下のようなシステムを言い、「検索」部分と「生成」部分で構成されています。
既存著作物を生成AIに入力してAI生成物を生成する場面(上記RAGの「2 生成部分」)において、入力対象著作物の生成AI内の解析やAI生成物の生成(上記⑦⑧)は「情報解析」(30条の4)に該当しますが、入力対象著作物を一部でも出力させる目的がある場合には、入力時点(上記⑥の時点)で入力対象著作物の享受目的が併存していることになるので、30条の4は適用されません。
この点は素案の記載の通りだと思います。
ちなみに素案で「検索拡張生成(RAG)のうち、生成に際して著作物の一部を出力させることを目的としたもの」と記載があるように、「RAG=入力された既存著作物の(一部)出力がされる」ということではありません。
RAGには様々な種類があり、検索→入力された著作物が全く出力されないタイプのRAGもあります(この点については第4回委員会の澤田委員発言参照2【澤田委員】御説明ありがとうございました。質問なんですけれども、資料1-2の2ページ目のところの※書きにある検索拡張生成に関して、先ほどの御説明の中で既存の著作物の一部が出るという想定でお話をされていたようにも聞こえましたが、検索拡張生成という技術自体は必ずしも著作物の一部をそのままアウトプットするものには限られてないと理解しています。いかがでしょうか。
【三輪著作権課調査官】事務局でございます。今、澤田委員御指摘のとおりでございまして、今御紹介いたしましたのは、検索拡張生成等で著作物を利用する場合にはこのような権利制限規定の適用が考えられる、というものでございまして、必ずしも出力の段階でRAGであれば全て著作物を使うということを前提としたものではございません。
)。
RAGには、法的な観点で大きく分けると以下の3つのパターンがあります。
▼ パターン1
出力結果として新たな生成結果及び同時入力文書の全部が表示される
▼ パターン2
出力結果として新たな生成結果及び同時入力文書の一部が表示される
▼ パターン3
出力結果として新たな生成結果のみが表示され同時入力文書の内容が一切表示されない
このうち、パターン1及び2のRAGについては、入力対象著作物の享受目的があるため30条の4は適用されません(ただし、パターン2のRAGについては47条の5第2項が適用されて適法になる可能性があります。素案P5「ウ 検索拡張生成(RAG)等について」参照)。
一方、パターン3のRAGについては、入力対象著作物の享受目的が無いため、30条の4が適用されると考えられます(素案P16【その他の論点】ク参照)。
○ これに対して、「学習データをそのまま出力させる意図までは有していないが、少量の学習データを用いて、学習データの影響を強く受けた生成物が出力されるようなファインチューニングを行うため、著作物の複製等を行う場合」に関しては、具体的事案に応じて、学習データの著作物の表現上の本質的特徴を直接感得できる生成物を出力することが目的であると評価される場合は、享受目的が併存すると考えられる。
これは素案が書いているように、具体的事案によりますね。
「学習データの影響を強く受けた生成物の出力を目的とする」と言うだけでは享受目的併存(=30条の4が適用されない)にはならず、「学習データの著作物の表現上の本質的特徴を直接感得できる生成物の出力を目的とする」必要があると思われます。
○ 近時は、特定のクリエイターの作品である著作物のみを学習データとしてファインチューニングを行うことで、当該作品群の影響を強く受けた生成物を生成することを可能とする行為が行われており、このような行為によって特定のクリエイターの、いわゆる「作風」を容易に模倣できてしまうといった点に対する懸念も示されている。このような場合、当該作品群は、表現に至らないアイデアのレベルにおいて、当該クリエイターのいわゆる「作風」を共通して有しているにとどまらず表現のレベルにおいても、当該作品群には、これに共通する表現上の本質的特徴があると評価できる場合もあると考えられることに配意すべきである。
うーん。。
「当該作品群は、表現に至らないアイデアのレベルにおいて、当該クリエイターのいわゆる「作風」を共通して有しているにとどまらず表現のレベルにおいても、当該作品群には、これに共通する表現上の本質的特徴があると評価できる場合」。。。
本当にそのような場合があれば、享受目的併存といえるのでしょうが、具体的にどのような場合を指しているか、ちょっと想定できないです。
○ なお、生成・利用段階において、AIが学習した著作物に類似した生成物が生成される事例があったとしても、通常、このような事実のみをもって開発・学習段階における享受目的の存在を推認することまではできず、法第30条の4の適用は直ちに否定されるものではないと考えられる。他方で、生成・利用段階において、学習された著作物に類似した生成物の生成が頻発するといった事情は、開発・学習段階における享受目的の存在を推認する上での一要素となり得ると考えられる。
ここはさらっと記載されていますが、特にAI開発者やAIサービス提供者にとって、非常に重要です。
享受目的併存かどうか、というのは、あくまで「AI学習時」に享受目的(学習対象著作物と類似生成物を生成する目的)があるかの問題であり、AI学習時にはそのような目的がなかったが、結果的に生成・利用段階においてAIが学習した著作物に類似した生成物が生成されたからといって、学習時に遡って必ずそのような目的があると認定されるわけではありません。
仮にそのような解釈をとってしまうと、AI利用者が生成・利用段階でAIが学習した著作物に類似した生成物を生成した場合、常にAI開発者やAIサービス提供者のAI学習に享受目的がある(=学習のための著作物利用行為が著作権侵害になる)ことになるためです。
実際にはAI学習時に享受目的があるかどうかは、素案が言うように「生成・利用段階において、学習された著作物に類似した生成物の生成が頻発するといった事情」の有無によって判断されることになると思います。
(4) 検索拡張生成(RAG)等について
ウ 検索拡張生成(RAG)等について〔骨子案:(1)ウ、(2)コ〕
○ 検索拡張生成(RAG)その他の、生成AIによって著作物を含む対象データを検索し、その結果の要約等を行って回答を生成するもの(以下「RAG等」という。)については、生成に際して既存の著作物の一部を出力するものであることから、その開発のために行う著作物の複製等は、非享受目的の利用行為とはいえず、法第30条の4は適用されないと考えられる。○ 他方で、RAG等による回答の生成に際して既存の著作物を利用することについては、法第47条の5第1項第1号又は第2号の適用があることが考えられる。ただし、この点に関しては、法第47条の5第1項に基づく既存の著作物の利用は、当該著作物の「利用に供される部分の占める割合、その利用に供される部分の量、その利用に供される際の表示の精度その他の要素に照らし軽微なもの」(軽微利用)に限って認められることに留意する必要がある。RAG等による生成に際して、この「軽微利用」の程度を超えて既存の著作物を利用する場合は、法第47条の5第1項は適用されず、原則として著作権者の許諾を得て利用する必要があると考えられる。
○ また、RAG等のために行うベクトルに変換したデータベースの作成等に伴う、既存の著作物の複製又は公衆送信については、同条第2項に定める準備行為として、権利制限規定の適用を受けることが考えられる。
この部分は素案の書き方があまり良くないと思うのですが、この部分の記載はあくまでRAGのうち「生成に際して既存の著作物の一部を出力するもの」に限ってのみ当てはまると考えます。
あたかも、全てのRAGが「生成に際して既存の著作物の一部を出力するもの」であるかのような書き方はちょっと誤解を招くと思います。
そして、RAGのうち「生成に際して既存の著作物の一部を出力するもの」に限って言えば、素案が言うとおり、回答の生成に際して既存の著作物を利用することについては以下のような整理になるでしょう。
▼ 享受目的があるので30条の4は適用されない。
▼ ただし、RAGにおける「既存の著作物の一部の出力」が「軽微利用」等、47条の5第1項の要件を満たす場合は、当該出力行為(著作物の一部の利用行為)については47条の5第1項第1号または第2号が適用される可能性がある。「軽微利用」の程度を越える場合には同条は適用されない(その結果、他の権利制限の適用がなければ著作権侵害に該当する)。
▼ RAGにおける「既存の著作物の一部の出力」が「軽微利用」等、47条の5第1項の要件を満たす場合は、RAGのためのベクトルDB作成等(複製・公衆送信)は、47条の5第2項により適法となる可能性がある。
一方、先ほど述べたようにRAGには「生成に際して既存の著作物を全く出力しないもの」もあります。
そのようなRAGの場合には、回答生成に際して既存著作物を利用することについては、30条の4が適用されて適法になると考えます。
(5) 法第30条の4ただし書について
【著作権者の利益を不当に害することとなる場合について】
エ 著作権者の利益を不当に害することとなる場合の具体例について〔骨子案:(1)エ〕(ア)法第30条の4ただし書の解釈に関する考え方について
○ 法第30条の4においては、そのただし書において「当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。」と規定し、これに該当する場合は同条が適用されないこととされている。
○ この点に関して、本ただし書は、法第30条の4本文に規定する「当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合」に該当する場合にその適用可否が問題となるものであることを前提に、その該当性を検討することが必要と考えられる。
○ また、本ただし書への該当性を検討するに当たっては、著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的販路を阻害するかという観点から検討することが必要と考えられる。
概ね異論はないのですが、最後の「また、本ただし書への該当性を検討するに当たっては、著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的販路を阻害するかという観点から検討することが必要と考えられる。」の部分については注意が必要だと思っています。
このように解釈する根拠としては、「同様のただし書を置いている他の権利制限規定(法第35条第1項等)と同様に」という理由しか、私は見たことがないのですが(基本的な考え方問9)、35条と30条の4とでは同じ権利制限規定でも、その趣旨が異なります。
つまり、2018年改正の際に、「柔軟性のある権利制限規定」については、権利者に及び得る不利益の度合い等に応じて、第1層(著作物の本来的利用には該当せず,権利者の利益を通常害さないと評価できる)、第2層(著作物の本来的利用には該当せず,権利者に及び得る不利益が軽微な行為類型)、第3層{公益的政策実現のために著作物の利用の促進が期待される行為類型)に分類して検討されています(平成29年報告書P38)。
そして、30条の4は第1層に、35条は第3層に位置づけられていますので、それぞれの条文における但書の解釈は、仮に同じ文言が条文上規定されているとしても、異なっていて当然ではないかと思うんですよね3なお、この「本ただし書への該当性を検討するに当たっては、著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的販路を阻害するかという観点から検討することが必要と考えられる。」という部分は、基本的な考え方9頁、及び松田政行 編『著作権法コンメンタール別冊 平成30年・令和2年改正解説』(勁草書房、2022年)31頁にも全く同じ記載があります。この記載の基となったのは、おそらく加戸守行「著作権法逐条解説講義」の35条1項ただし書に関する記述(第7訂新版では324頁)ではないかと思われますが、同記述の正確な内容は、第7訂新版だと「(35条第1項ただし書に該当するかは)著作権者の著作物利用市場と衝突するかどうかでありまして、学校等の教育機関で複製等の行為が行われることによって、現実に市販物の売れ行きが低下するかどうか、将来における著作物の潜在的的販路を阻害するかどうかで判断するということになります。」というものです。
とすると、基本的な考え方や素案における「著作物の利用市場との衝突」とは、具体的には「現実に市販物の売れ行きが低下すること」を意味することになります。。
(イ)アイデア等が類似するにとどまるものが大量に生成されることについて
○ 本ただし書において「当該著作物の」と規定されているように、著作権者の利益を不当に害することとなるか否かは、法第30条の4に基づいて利用される当該著作物について判断されるべきものと考えられる。
(例)AI学習のための学習データとして複製等された著作物
○ 作風や画風といったアイデア等が類似するにとどまり、既存の著作物との類似性が認められない生成物は、これを生成・利用したとしても、既存の著作物との関係で著作権侵害とはならない。また、既存の著作物とアイデア等が類似するが、表現として異なる生成物が市場において取引されたとしても、これによって直ちに当該既存の著作物の取引機会が失われるなど、市場において競合する関係とはならないと考えられる。
○ そのため、著作権法が保護する利益でないアイデア等が類似するにとどまるものが大量に生成されることにより、自らの市場が圧迫されるかもしれないという抽象的なおそれのみでは、「著作権者の利益を不当に害することとなる場合」には該当しないと考えられる。
○ なお、この点に関しては、上記イ(イ)のとおり、特定のクリエイターの作品である著作物のみを学習データとしてファインチューニングを行う場合、当該作品群が、当該クリエイターの作風を共通して有している場合については、これにとどまらず、表現のレベルにおいても、当該作品群には、これに共通する表現上の本質的特徴があると評価できる場合もあると考えられることに配意すべきである。
作風や画風はアイデアであり「表現」ではないことから、著作権法の保護対象ではありません。
それを前提とすると、素案記載に違和感はありません。
(ウ)情報解析に活用できる形で整理したデータベースの著作物の例について
○ 本ただし書に該当すると考えられる例としては、「基本的な考え方 」(9頁)において、「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物が販売されている場合に,当該データベースを情報解析目的で複製等する行為」が既に示されている。○ この点に関して、上記の例で示されている「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物」としては、DVD等の記録媒体に記録して提供されるもののみならず、インターネット上でファイルのダウンロードを可能とすることや、データの取得を可能とするAPI(Application Programming Interface)の提供などにより、オンラインでデータが提供されるものも含まれ得ると考えられる。
○ また、「当該データベースを(……)複製等する行為」に関しては、データベースの著作権は、データベースの全体ではなくその一部分のみが利用される場合であっても、当該一部分でも著作物としての価値が認められる部分が利用されれば、その部分についても及ぶ(加戸守行『著作権法逐条講義 七訂新版』(公益社団法人著作権情報センター、2021年)142頁)とされている。
○ これを踏まえると、例えば、インターネット上で、データベースの著作物から情報解析に活用できる形で整理されたデータを取得できるAPIが有償で提供されている場合において、当該APIを有償で利用することなく、当該データベースに含まれる一定の情報のまとまりを情報解析目的で複製する行為は、法第30条の4ただし書に該当し、同条による権利制限の対象とはならないと考えられる(脚注3)。
▼脚注3
具体例としては、学術論文の出版社が論文データについてテキスト・データマイニング用ライセンス及びAPIを提供している事例や、新聞社が記事データについて同様のライセンス及びAPIを提供している事例等がある。
30条の4ただし書きに該当する具体的例としてこれまで明示されてきたのは、素案記載の通り「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物が販売されている場合に,当該データベースを情報解析目的で複製等する行為」でした。
「基本的な考え方」や、令和5年度著作権セミナー「AIと著作権」の資料P40では、それ以外の行為の但書該当性について「最終的には司法の場で個別具体的に判断される」としていましたが、素案では、この行為についてかなり踏み込んで分析をしています。
この部分でも、後の「(エ)学習のための複製等を防止する技術的な措置を回避した複製について」においても、データベースの著作物についての記述があることから、まず著作権法上のデータベース及びデータベース著作物の扱いについて説明します。
ちょっと長いですが重要な部分です。
ア 著作権法上の「データベース」及び「データベース著作物」の定義
著作権法上は「データベース」とは「論文、数値、図形その他の情報の集合物であつて、それらの情報を電子計算機を用いて検索することができるように体系的に構成したもの」(著作権法2条1項10の3)と定義され、「データベースの著作物」とは「データベースでその情報の選択又は体系的な構成によつて創作性を有するもの」(法12条の2第1項)と定義されています。
データ、データベース、データベース著作物を概念的に比較すると以下のような関係になります。
つまり、著作権法上、データベース(以下「DB」といいます)のうち、一定の要件(「データベースでその情報の選択又は体系的な構成によつて創作性を有する」)を満たしたものだけが、DBの著作物として保護されるのであって、それ以外のDBについては著作物ではないということになります。
イ データベースとデータベース内のデータとの関係
また、データベースやデータベースの著作物については、それを構成する各データが著作物に該当するものと該当しないものがあります。
前者の場合、当該データで構成されているデータベース著作物は、個々の著作物データと別の著作物として保護されます。
ちょうど下記表のようなイメージですね。
ウ 素案の検討
以上を前提に素案について検討します。
素案は、「インターネット上で、データベースの著作物から情報解析に活用できる形で整理されたデータを取得できるAPIが有償で提供されている場合において、当該APIを有償で利用することなく、当該データベースに含まれる一定の情報のまとまりを情報解析目的で複製する行為は、法第30条の4ただし書に該当し、同条による権利制限の対象とはならないと考えられる」としています。
ただ、上記の著作権法上のデータベースの扱いを前提とすると、素案のこの部分は
① 単なるデータベースではなく、データベースの著作物がAPI経由で有償提供されている場合において、
② 当該APIを有償で利用することなく、
② 当該データベースの著作物のうち、著作物としての価値が認められる部分(具体的には、それ自体がデータベースの著作物に該当するもの)を、
④ 情報解析目的で複製する場合のみを指している
と読むべきだと思います。
つまり、そもそもAPI経由で有償提供されているDBがDBの著作物に該当しない場合、または、提供されているDBがDB著作物であったとしても、取得者が取得するデータ(ベース)が、データベース著作物に該当しないものである場合は、上記素案の例示には該当せず、30条の4但書に該当しないという整理になるのではないでしょうか。
素案では「当該データベースに含まれる一定の情報のまとまり」と記載されており、この点は明確ではないのですが・・・
(エ)学習のための複製等を防止する技術的な措置を回避した複製について〔骨子案:(1)コ〕
○ AI学習のための著作物の複製等を防止する技術的な措置としては、現時点において既に広く行われているものが見受けられる。こうした措置をとることについては、著作権法上、特段の制限は設けられておらず、権利者やウェブサイトの管理者の判断によって自由に行うことが可能である。
(例)ウェブサイト内のファイル”robots.txt”への記述によって、AI学習のための複製を行うクローラによるウェブサイト内へのアクセスを制限する措置
(例)ID・パスワード等を用いた認証によって、ウェブサイト内へのアクセスを制限する措置○ このような技術的な措置は、あるウェブサイト内に掲載されている多数のデータを集積して、情報解析に活用できる形で整理したデータベースの著作物として販売する際に、当該データベースの販売市場との競合を生じさせないために講じられている例がある(データベースの販売に伴う措置、又は販売の準備行為としての措置)(脚注4)。
▼脚注4
具体例としては、The New York Times(米国)が自社記事を掲載するウェブサイトのrobots.txtにおいてAI学習データ収集用クローラをブロックし、別途、テキスト・データマイニング用ライセンス及びAPIを提供している事例や、Financial Times、The Guardian(いずれも英国)が同様の取組を行っている事例、Axel Springer(ドイツ)が傘下メディアの記事を掲載するウェブサイトのrobots.txtにおいてAI学習データ収集用クローラをブロックし、別途、OpenAI(米国)に対してAI学習及びAIによる要約等の生成に関する記事データのライセンスを提供している事例等がある。○ そのため、このような技術的な措置が講じられており、当該ウェブサイト内のデータを含み、情報解析に活用できる形で整理したデータベースの著作物が将来販売される予定があることが推認される場合、この措置を回避して行うAI学習のための複製等は、当該データベースの著作物の将来における潜在的販路を阻害する行為として、通常、法第30条の4ただし書に該当し、同条による権利制限の対象とはならないと考えられる。
○ なお、このような技術的な措置が、著作権法に規定する「技術的保護手段」又は「技術的利用制限手段」に該当するか否かは、現時点において行われている技術的な措置が、従来、「技術的保護手段」又は「技術的利用制限手段」に該当すると考えられてきたものとは異なることから、今後の技術の動向も踏まえ検討すべきものと考えられる。
個人的に一番問題を感じている部分です。
素案が示している内容を分解すると以下のとおりとなります。
① あるウェブサイト内に掲載されているデータについてrobots.txtの記述やID・パスワード認証のような、AI学習のための著作物の複製等を防止する技術的な措置が講じられており
② 当該ウェブサイト内のデータを含み、情報解析に活用できる形で整理したデータベースの著作物が将来販売される予定があることが推認される場合
③ この措置を回避して行うAI学習のための複製等
については「当該データベースの著作物の将来における潜在的販路を阻害する行為」に該当するため、通常、法第30条の4ただし書に該当し、同条による権利制限の対象とはならないと考えられる
しかし、本当に上記①②③の要件を満たすだけで「当該データベースの著作物の将来における潜在的販路を阻害する行為」に該当するのでしょうか。
そもそも、まだ存在もしていない、販売もされていないデータベースの著作物の、かつ、潜在的販路(対象物が存在していないから当然ですが)を阻害する行為とは何なのでしょう。また、仮にデータベースの著作物が販売されていたとしても、当該データベースの著作物そのものではなく、その構成要素であるデータを複製することが、当該データベースの著作物の市場を侵害することになるのでしょうか。
30条の4ただし書きに該当する具体例としてこれまで明示されて来た例である「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物が販売されている場合に,当該データベースを情報解析目的で複製等する行為」は、「すでに存在し、かつすでに販売されているデータベース著作物」そのものの情報解析目的の複製(つまり構成要素であるデータの複製ではない)ですので、当該データベース著作物の市場を害することが明確な例でした。
また、立法担当者による30条の4ただし書きに関する解説4松田政行 編『著作権法コンメンタール別冊 平成30年・令和2年改正解説』(勁草書房、2022年)31頁においても、「一般論としては,ある非享受目的の利用を本来的な利用目的として創作された著作物について,当該目的で利用する行為については,このただし書に該当することが多いと考える」としており、「すでに存在している著作物」についての市場との衝突を問題にしています。
今回の素案をそのまま読むと、著作権者がウェブサイト内のデータについて「将来情報解析に活用できる形で整理したデータベースの著作物が将来販売される予定がある」と主張し、rbots.txtの記述を含む何らかの技術的な措置を講じているだけで、ただし書に該当することになる可能性が高いでしょう。
そうなると、AI開発のためのデータ収集に非常に大きな萎縮効果をもたらします。
しかし、このような解釈は、実質的には、未だ存在していないデータベース著作物、あるいは著作物に該当しないデータベースを著作権法で保護するという効果をもたらしますので、著作権法の守備範囲を超えているように思えてなりません5もちろん、著作物に該当しないデータベースに関する法的保護が十分ではないという問題意識は、昔から産業界を中心に共有されていますが、その問題意識を踏まえて制定されたのが不正競争防止法の限定提供データ制度だったはずです。。
また、30条の4但書の解釈において、35条但書と同様「著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的販路を阻害するかという観点から検討」するにしても、そこでいう「市場」とは、「利用対象となっている著作物の市場」であるはずです。「将来における著作物の潜在的販路を阻害する」は「(当該)著作物の将来における潜在的販路を阻害する」という意味であって「将来発生する著作物の潜在的販路を阻害する」という意味ではありません。
素案が示したケースにおいて、利用対象となっている著作物は、ウエブサイト内の個々の「著作物データ」であり、「データベース」ではありません。要するに、データの保護を重視するあまり、それとは別の著作物であるデータベースの著作物(あるいはデータベースの著作物に該当しない単なるデータベース)をも保護する結果をもたらすのではないかという懸念があります。
繰り返しになりますが、「基本的な考え方 」(9頁)において示されている、「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物が販売されている場合に,当該データベースを情報解析目的で複製等する行為」が30条の4ただし書に該当することには異議がありません。この場合、①すでに販売されているデータベース著作物について、②当該データベース著作物の複製がなされていますので、当該データベース著作物の利用市場との衝突が生じているからです。
一方、「未だ存在しない、販売もされていないデータベース著作物」についての利用市場との衝突を問題としたり、当該データベース著作物の利用行為そのものではなく、その中身であるデータの利用行為を制限することはおかしいと思います。
以上の理由から、素案のこの部分については、理論的にも難があり、AI開発のためのデータ収集に非常に大きな萎縮効果をもたらすため、個人的には明確に反対します。
(6) 海賊版等の権利侵害複製物をAI学習のため複製することについて
(オ)海賊版等の権利侵害複製物をAI学習のため複製することについて
○ インターネット上のデータが海賊版等の権利侵害複製物であるか否かは、究極的には当該複製物に係る著作物の著作権者でなければ判断は難しく、AI学習のため学習データの収集を行おうとする者にこの点の判断を求めることは、現実的に難しい場合が多いと考えられる。加えて、権利侵害複製物という場合には、漫画等を原作のまま許諾なく多数アップロードした海賊版サイトに掲載されているようなものから、SNS等において個人のユーザーが投稿する際に、引用等の権利制限規定の要件を満たさなかったもの等まで様々なものが含まれる。
○ このため、AI学習のため、インターネット上において学習データを収集する場合、収集対象のデータに、海賊版等の、著作権を侵害してアップロードされた複製物が含まれている場合もあり得る。
○ 他方で、海賊版により我が国のコンテンツ産業が受ける被害は甚大であり、リーチサイト規制を含めた海賊版対策を進めるべきことは論を待たない。文化庁においては、権利者及び関係機関による海賊版に対する権利行使の促進に向けた環境整備等、引き続き実効的かつ強力に海賊版対策に取り組むことが期待される。
○ AI開発事業者やAIサービス提供事業者においては、学習データの収集を行うに際して、海賊版を掲載しているウェブサイトから学習データを収集することで当該ウェブサイトの運営を行う者に広告収入その他の金銭的利益を生じさせるなど、当該行為が新たな海賊版の増加といった権利侵害を助長するものとならないよう十分配慮した上でこれを行うことが求められる。
○ また、後掲(2)キのとおり、生成・利用段階で既存の著作物の著作権侵害が生じた場合、AI開発事業者又はAIサービス提供事業者も、当該侵害行為の主体として責任を負う場合があり得る。ウェブサイトが海賊版等の権利侵害複製物を掲載していることを知りながら、当該ウェブサイトから学習データの収集を行うといった行為は、厳にこれを慎むべきものであり、仮にこのような行為があった場合は、当該AI開発事業者やAIサービス提供事業者が、これにより開発された生成AIにより生じる著作権侵害について、その関与の程度に照らして、規範的な行為主体として侵害の責任を問われる可能性が高まるものと考えられる(AI開発事業者又はAIサービス提供事業者の行為主体性について、後掲(2)キも参照)。
この部分の素案の記載は、違法にアップロードされた著作物をAI学習のため複製することが一般的に30条の4ただし書に該当するとするものではありません(ちなみに、違法にアップロードされた著作物を利用した場合に権利制限の対象とならないということは、30条1項3号4号や47条の5第1項ただし書には明記されてますが、30条の4にはそのような定めはありません)。
「学習データの収集を行うに際して、海賊版を掲載しているウェブサイトから学習データを収集することで当該ウェブサイトの運営を行う者に広告収入その他の金銭的利益を生じさせるなど、当該行為が新たな海賊版の増加といった権利侵害を助長するもの」とならないように配慮すべしとし、かつ「ウェブサイトが海賊版等の権利侵害複製物を掲載していることを知りながら、当該ウェブサイトから学習データの収集を行うといった行為」があった場合には、関与の程度に照らして侵害主体としての責任を問われる可能性がある、とするものであり、特に異議・違和感ありません。
なお、第4回小委員会の議事録を見る限りは、海賊版を学習対象にすることについて、30条の4ただし書に該当するなど例外的に取扱うことについて、少なくとも法解釈上は否定的な意見が大勢を占めているように思います。
(7) 侵害に対する措置について
【侵害に対する措置について】
オ AI学習に際して著作権侵害が生じた際に、学習を行った事業者が受け得る措置について〔骨子案:(1)オ〕
○ 享受目的が併存する、又はただし書に該当する等の理由で法第30条の4が適用されず、他の権利制限規定も適用されない場合、権利者からの許諾が得られない限り、AI学習のための複製は著作権侵害となる。
○ この場合、AI学習のための複製を行った者が受け得る措置としては、損害賠償請求(民法第709条)、侵害行為の差止請求(法第112条第1項)、将来の侵害行為の予防措置の請求(同条第2項)、刑事罰(法第119条)等が規定されている。
○ なお、損害賠償請求についてはその要件として故意又は過失の存在が、刑事罰については故意の存在が必要となる。
ここも当然のことなので特に異議ありません。
カ AI学習に際して著作権侵害が生じた際に、権利者による差止請求等が認められ得る範囲について〔骨子案:(1)カ〕
(ア)将来のAI学習に用いられる学習用データセットからの除去の請求について
○ AI学習に際して著作権侵害が生じた際は、上記(1)オのとおり、AI学習のための複製を行った者に対し、侵害行為の差止請求(法第112条第1項)及び将来の侵害行為の予防措置の請求(同条第2項)が考えられる。○ このうち、将来の侵害行為の予防措置の請求は、将来において侵害行為が生じる蓋然性が高いといえる場合に、あらかじめこれを防止する措置を請求できるとするものである。そのため、著作権侵害の対象となった当該著作物が、将来においてAI学習に用いられることに伴って、複製等の侵害行為が新たに生じる蓋然性が高いといえる場合は、当該AI学習に用いられる学習用データセットからの当該著作物の除去が、将来の侵害行為の予防措置の請求として認められ得ると考えられる。
(イ)学習済みモデルの廃棄請求について
○ 法第112条第2項では、侵害の停止又は予防に必要な措置としての廃棄請求の対象となるものとして「侵害の行為を組成した物、侵害の行為によつて作成された物又は専ら侵害の行為に供された機械若しくは器具」が規定されている。
○ AI学習により作成された学習済モデルは、通常、学習に用いられた著作物の複製物とはいえず、「侵害の行為を組成した物」又は「侵害の行為によつて作成された物」には該当しないと考えられる。また、通常、AI学習により作成された学習済モデルは、学習データである著作物と類似しないものを生成することができると考えられることから、「専ら侵害の行為に供された機械若しくは器具」にも該当しないと考えられる。そのため、AI学習により作成された学習済モデルについての廃棄請求は、通常、認められないものと考えられる。
○ 他方で、当該学習済モデルが、学習データである著作物と類似性のある生成物を高確率で生成する状態にある等の場合(脚注5)は、学習データである著作物の本質的特徴が当該学習済モデルに残存しているとして、法的には、当該学習済モデルが学習データである著作物の複製物であると評価される場合も考えられ、このような場合は、「侵害の行為を組成した物」又は「侵害の行為によつて作成された物」として、当該学習済モデルの廃棄請求が認められる場合もあり得る。また、この場合は、当該学習済モデルが、学習データである著作物と類似性のある生成物の生成(すなわち複製権侵害を構成する複製)に専ら供されたとして「専ら侵害の行為に供された機械若しくは器具」として廃棄請求が認められる場合もあり得る(脚注6)。
▼ 脚注5
上記(1)イのように、学習データである著作物に表現された思想又は感情を享受する目的が併存しているといえる場合、このような目的の下で行われたAI学習により作成された学習済モデルは、特に、学習データである著作物と類似性のある生成物を高確率で生成する状態となっており、「侵害の行為によつて作成された物」等として、当該学習済モデルの廃棄請求が認められる場合も多くあると考えられる。▼ 脚注6
AI学習に際して著作権侵害が生じた際に、学習に用いられた特定の著作物による学習済モデルへの影響を取り除く措置を請求することは、その技術的な実現可能性や、技術的に可能としてもこれに要する時間的・費用的負担の重さ等(例えば特定の学習データを学習用データセットから除去した状態で再度学習済モデルの作成を行う場合、当初の学習と同程度の時間的・費用的負担が生じると考えられる。)から、通常、このような措置の請求は認められないと考えられる。
この部分は、実際に著作権侵害が生じた場合に、権利者が侵害者に対して、損害賠償請求以外に何ができるかを検討した部分であり実務的にも重要です。
ちなみに、この部分に記載されているのは「AI学習に際して著作権侵害が生じた場合の措置」の話であり「AI生成物の生成・利用に際して著作権侵害が生じた場合の措置」と分けて考える必要があります(後者については、素案「(2)生成・利用 エ 侵害に対する措置について」に記載されています。)
「AI学習に際して著作権侵害が生じた場合の措置」について損害賠償請求以外に考えられるのは、素案が示しているように「侵害行為の差止請求(法第112条第1項)」と「将来の侵害行為の予防措置の請求(同条第2項)」ですが「侵害行為の差止請求(法第112条第1項)」については、すでに侵害行為(学習のための複製行為)は終了してしまっているので意味がありません。
したがって、「将来の侵害行為の予防措置の請求(同条第2項)」として何が可能かが問題となりますが、素案は①将来のAI学習に用いられる学習用データセットからの除去の請求、②学習済みモデルの廃棄請求、③学習に用いられた特定の著作物による学習済モデルへの影響を取り除く措置請求(例えば特定の学習データを学習用データセットから除去した状態で再度学習済モデルの作成)を例としてあげています。
そして、素案は「① 将来のAI学習に用いられる学習用データセットからの除去の請求」については「著作権侵害の対象となった当該著作物が、将来においてAI学習に用いられることに伴って、複製等の侵害行為が新たに生じる蓋然性が高いといえる場合」に認められるとしていますが、合理的だと思います。
注意しなければならないのは、単純に「著作権侵害の対象となった当該著作物が学習用データセットに含まれている場合」にこの請求を認めるものではなく、あくまで「将来においてAI学習に用いられることに伴って、複製等の侵害行為が新たに生じる蓋然性が高いといえる場合」に限って認められる、としていることです。具体的には、②にあるような「学習データである著作物と類似性のある生成物を高確率で生成する状態」のAIモデルの学習に利用される場合に限って、この「蓋然性が高い」と評価されることになるでしょう。
次に、素案は「② 学習済みモデルの廃棄請求」については「AI学習により作成された学習済モデルについての廃棄請求は、通常、認められないものと考えられる。」としつつ「当該学習済モデルが、学習データである著作物と類似性のある生成物を高確率で生成する状態にある等の場合」には、学習済みモデルの廃棄請求が認められる場合もありうる、としています。
これも、脚注5の内容を含め特に違和感ありません。
最後に、素案は「③学習に用いられた特定の著作物による学習済モデルへの影響を取り除く措置請求」については、技術的な実現可能性や、技術的に可能としてもこれに要する時間的・費用的負担の重さ等から、通常、このような措置の請求は認められないと考えられるとしており、この点も同意です。もしこれが認められると、AI開発者は非常に大きい負担を負うことになってしまいます。
(8) その他の論点について
【その他の論点について】
キ AI学習における、法第30条の4に規定する「必要と認められる限度」について〔骨子案:(1)ク〕
○ 法第30条の4では、「その必要と認められる限度において」といえることが、同条に基づく権利制限の要件とされている。
○ この点に関して、大量のデータを必要とする機械学習(深層学習)の性質を踏まえると、AI学習のために複製等を行う著作物の量が大量であることをもって、「必要と認められる限度」を超えると評価されるものではないと考えられる。
異議・違和感ありません。
ク AI学習を拒絶する著作権者の意思表示について〔骨子案:(1)ケ〕
○ 著作権法上の権利制限規定は、①著作物利用の性質からして著作権が及ぶものとすることが妥当でないもの、②公益上の理由から著作権を制限することが必要と認められるもの、③他の権利との調整のため著作権を制限する必要のあるもの、④社会慣行として行われており著作権を制限しても著作権者の経済的利益を不当に害しないと認められるものなどについて、文化的所産の公正な利用に配慮して、著作権者の許諾なく著作物を利用できることとするものである。
○ このような権利制限規定の立法趣旨からすると、著作権者が反対の意思を示していることそれ自体をもって、権利制限規定の対象から除外されると解釈することは困難である。また、AI学習のための学習データの収集は、クローラ等のプログラムによって機械的に行われる例が多いことからすると、当該プログラムにおいて機械的に判別できない方法による意思表示があることをもって権利制限規定の対象から除外してしまうと、学習データの収集を行う者にとって不測の著作権侵害を生じさせる懸念がある。そのため、こうした意思表示があることのみをもって、法第30条の4ただし書に該当するとは考えられない。
○ 他方で、このようなAI学習を拒絶する著作権者の意思表示が、機械可読な方法で表示されている場合、上記の不測の著作権侵害を生じさせる懸念は低減される。また、このような場合、上記エ(エ)のとおり、AI学習のための著作物の複製等を防止する技術的な措置が講じられており、当該ウェブサイト内のデータを含み、情報解析に活用できる形で整理したデータベースの著作物が将来販売される予定があることが推認される場合、この措置を回避して行うAI学習のための複製等は、当該データベースの著作物の将来における潜在的販路を阻害する行為として、通常、法第30条の4ただし書に該当し、同条による権利制限の対象とはならないと考えられる。
2文目ではAI学習を拒絶する著作権者の意思表示があることだけで30条の4ただし書に該当するとは考えられないとしており、賛成です。
一方、3文目については個人的には強く反対するところですが、先ほど述べたとおりですので繰り返しません。
ケ 法30条の4以外の権利制限規定の適用について〔骨子案:(1)サ〕
○ 著作権法上の権利制限規定としては、上記の法第30条の4及び第47条の5のほか、法第2章第3節第5款において複数の規定が設けられている。
○ この点に関して、AI学習のための著作物の複製等については、上記の法第30条の4及び第47条の5以外にも、当該複製等を対象とする権利制限規定が適用される場合であれば、権利者の許諾を得ることなく適法に行うことができる。
○ 適用があり得ると考えられる権利制限規定としては、具体的には、私的使用目的の複製(法第30条第1項)、学校その他の教育機関における複製等(法第35条)が考えられる。
○ そのため、例えば、個人的に又は家庭内その他これに準ずる限られた範囲内においてAI学習のために使用する目的で行う場合、AI学習のための学習データの収集に伴う複製は、法第30条の4の適用の有無に関わりなく、権利者の許諾を得ることなく適法に行うことができると考えられる。
○ なお、このように私的使用目的の複製(法第30条第1項)に基づいてAI学習のための学習データの収集に伴う複製を行った場合は、法第30条の4に基づいて複製を行った場合と異なり、収集した学習データをAI学習のためのデータセットとして第三者に譲渡したり、公衆送信したりする行為には法第30条第1項の権利制限規定は適用されない。このように、それぞれの権利制限規定において、権利者の許諾を得ることなく可能とされている行為が異なることには留意する必要がある(脚注7)。
▼脚注7
法第30条の4においては、非享受目的の利用であること等の同条の要件を満たす限り、譲渡や公衆送信を含め、いかなる方法でも著作物を利用できることとされている。これに対して、法第30条第1項においては、対象となる利用行為が複製に限定されている。
権利制限規定は排他的なものではありませんので複数の権利制限規定が重複して適用されることもありますし、ある権利制限規定が適用されなくても、別の権利制限規定が適用されれば適法に著作物を利用することができます。
素案では私的使用目的の複製(法第30条第1項)、学校その他の教育機関における複製等(法第35条)が紹介されていますが、これ以外にも検討過程における利用(法第30条の3)も適用される余地があると思います(素案17頁も参照)。
これらの30条の4以外の権利制限規定が適用される場合には、享受目的が併存している学習行為も適法に行いうることになります。
もっとも、この点も素案で明示されているように、30条の4以外の権利制限規定しか適用されない場合には、当該権利制限規定特有の規制に注意が必要です。
(9) まとめ
以上、素案のうち、「(1) 学習・開発段階」については、30条の4ただし書に関する部分を除いては、違和感・異存はありません。
一方、30条の4ただし書に関する部分については、これまでの小委員会の議論の経緯を見ても、いきなり出てきた内容のように思え、違和感を覚えます。