人工知能(AI)、ビッグデータ法務 著作権
AIと著作権【第4回】海賊版や学習禁止表示がされている著作物をAI学習に利用することができるか
2025年7月にSTORIA法律事務所の柿沼・杉浦の共著で日本加除出版から書籍「AIと法 実務大全」を出版します。
本書は650頁超というボリュームでありながらも、AI開発や利活用に問題となる点を「網羅的」に解説するものではありません。あくまで、現場の方がAI開発や利活用を行う際に、法律的によく問題となる論点とその解決手法に照準を絞っています。その分個々の論点については、最先端の議論を下敷きにしつつ実務的に相当深掘りした記述となっています。
書籍の出版に先立ち、その一部である「第2章 生成AI開発・提供・利用と著作権」について日本加除出版からご了解を得て、ブログで連載記事として先行公開することとしました。
「一部」といっても記事合計13万字を越えるボリューム(ほぼ新書1冊分!)であり、ブログ公開を快諾いただいた日本加除出版には感謝しかありません。
この連載記事を読んで興味が湧いた方は是非書籍をお買い求めください!
連載「AIと著作権」全18回の目次を表示
- 第1回 プレイヤー・フェーズ・提供形態による法的整理
- 第2回 AI学習段階での著作物利用はどこまで許されるか?──著作権法第30条の4の射程
- 第3回 学習用データとして“何を使ってはいけないか”を見極める~学習対象の観点からの検討~
- 第4回 海賊版や学習禁止表示がされている著作物をAI学習に利用することができるか
- 第5回 開発・学習段階での著作権侵害行為が発生した場合、侵害者はどのような責任を負うか
- 第6回 生成・利用段階では何が問題になるのか?
- 第7回 類似AI生成物の「生成」における依拠性をどのように考えるか~複雑な論点を解きほぐす~
- 第8回 類似AI生成物の「生成」における行為主体性~ロクラクⅡ事件判決をベースに徹底的に考える~
- 第9回 生成された類似AI生成物を利用すると著作権侵害?
- 第10回 類似AI生成物の「送信」は誰の責任?──クラウド提供型AIにおける著作権侵害リスクを検証する
- 第11回 生成・利用段階で著作権侵害行為が認められた場合、権利者は何を請求できるのか
- 第12回 RAG・ロングコンテクストLLMと著作権侵害(前編)
- 第13回 RAG・ロングコンテクストLLMと著作権侵害(後編)
- 第14回 RAGシステムのための既存著作物の蓄積・入力などは著作権侵害になるのか
- 第15回 RAGとAI利用者の責任~入力・送信・出力のそれぞれで何が問われるか?~
- 第16回 AI生成物に著作権はあるのか?~著作物性と“創作的寄与”の最新実務論~
- 第17回 その行為に日本著作権法は適用されるか~準拠法の問題~
- 第18回 で、結局何に気をつければよいのか~AI開発者・AI提供者・AI利用者それぞれの注意事項~
🔊 音声で内容を復習する
この記事の内容を、対話形式の音声で聞くことができます。
▶ 対話形式で聞く
※ 対話形式の音声はNotebookLMを利用して自動的に作成したものです。正確な内容は記事本文をご参照ください。
Contents
(イ) 海賊版等の権利侵害複製物
下記設例を基に、海賊版等の権利侵害複製物をAI学習に利用することが著作権侵害に該当しないかを検討します。
設例:Web上のデータやWeb上で公開されている学習用DSを大規模に収集して学習用DS及び生成AIを構築し、学習用DSとAIモデルを公開したところ、当該AIモデルの構築に利用した学習用DSの一部が海賊版のデータを含んでいることが判明した。このまま学習用DSやAIモデルを公開し続けて問題ないか。
(ⅰ) 原則
諸外国の情報解析規定においては、情報解析の客体が適法にアクセスしたものであることを条件とした立法例が多いです(英国法、欧州DSM指令、スイス法等)。そのような立法の下では、AI開発者が海賊版等をWEBサイトから収集して開発・学習に利用した場合、当該収集行為自体が著作権侵害となります。
一方、日本国著作権法の30条の4にはそのような条件が設けられていません。
そのため、AI開発者が海賊版等をWEBサイトから収集して開発・学習に利用する行為についても同条が適用されて原則として適法となります。
これは、何らかの理由で、AI開発者が、学習に利用したDSが海賊版等の権利侵害複製物であることを知っていた、あるいは事後的に知った(たとえば権利者からの警告により)としても同様だと考えます。
なお、「考え方」やパブコメにおいても、AI開発者が海賊版等をWEBサイトから収集して開発・学習に利用する行為が30条の4柱書但書に該当して著作権侵害になるという記載はありません1ただし、「考え方」28 頁には「AI 開発事業者やAI サービス提供事業者においては、学習データの収集を行うに際して、海賊版を掲載しているウェブサイトから学習データを収集することで、当該ウェブサイトへのアクセスを容易化したり、当該ウェブサイトの運営を行う者に広告収入その他の金銭的利益を生じさせるなど、当該行為が新たな海賊版の増加といった権利侵害を助長するものとならないよう十分配慮した上でこれを行うことが求められる。」との記載があり、パブコメ266 等においては「このような助長行為があった場合、個別具体的な事案によっては、侵害行為の幇助となる場合もあると考えられます。」と記載されている。。
むしろ文化庁小委員会の議論では各委員から以下のような指摘がなされており(第4回早稲田委員発言・澤田委員発言)、「考え方」は、AI開発者が海賊版等をWEBサイトから収集して開発・学習に利用する行為についても同条が適用されて原則として適法となることを前提としていると思われます。
各委員発言中の③は「学習のための複製を防止する技術的な措置が講じられているにも関わらず、これを回避して著作物をAI学習のため複製することは、本ただし書に該当するか。」の論点であり、④は「海賊版のような権利侵害複製物をAI学習のため複製することは、本ただし書に該当するか。」の論点です。
▼ 早稲田委員
それから、エの③のところですけれども、これも非常に難しいところではありますけれども、権利制限規定を技術的な措置で適用がないようにするという、それ自体は権利制限規定が強行法規、強行規定でなくて任意規定というように、解釈されるのだと思いますので、それはいいと思うんですけども、さらにそれを回避して複製した場合はどうなのかというのは、これはなかなか難しい問題ではあるとは思いますが、例えば47条の5のインターネット検索のURLを提示するようなところでは、それなりにそういう技術については、それを回避してはいけないような規定になっておりますので、そういう規定がない限りはちょっとこれもただし書には該当しないんじゃないかなと個人的には考えております。
そうしますと④の海賊版のような権利侵害複製物について、これも著作権者の非常に御懸念があるということは重々承知ではございますけれども、単に情報解析をするということであれば、海賊版であっても情報解析をするという目的には非享受目的であれば該当するのではないかなと思っておりますので、これもただし書には該当しないのではないかなと個人的には思っております。
▼ 澤田委員
③、④に関しまして、先ほど早稲田委員からも少し御指摘がありましたけれども、③の技術的な措置の回避については、これまでの著作権法の中でも例えば30条の私的複製の例外や47条の5のrobot.txtの例で、回避をしたら権利制限の対象外という規定がわざわざ設けられています。④の海賊版に関しても、30条や47条の5の1項のただし書で違法なものを用いるケースは権利制限の対象外ということは明記されているところです。
そのため、法体系全体の整合性からすると、特にそういった明記のない30条の4については、③、④の事情があるという一事をもってただし書に当たらない(筆者注:文脈からすると「ただし書に当たる」の誤記ではないかと思われます)ということにはならないのではないかと考えております。
(ⅱ) 例外
以上述べたように、AI開発者が海賊版等をWEBサイトから収集して開発・学習に利用する行為についても30条の4が適用されて原則として適法となるのですが、2つの例外があります。
① 開発・学習段階における著作物利用行為が著作権侵害となる場合
1つ目は、開発・学習段階における著作物利用行為に表現出力目的がある場合、当該利用行為が著作権侵害となる場合があるということです。
具体的には、少量の学習用データを用いて、学習用データに含まれる著作物の創作的表現の影響を強く受けた生成物が出力されるような追加的な学習を行うことを目的として海賊版等の権利侵害複製物を掲載するウェブサイトからの学習用データの収集を行う場合は、表現出力目的がある(享受目的併存)ため、30条の4が適用されず、それ以外の権利制限規定が適用されなければ違法となります。
この点については「考え方」28頁~29頁に以下の記載があります。
この点に関して、こうした海賊版等の権利侵害複製物を掲載するウェブサイトからの学習データの収集は、少量の学習データを用いて、学習データに含まれる著作物の創作的表現の影響を強く受けた生成物が出力されるような追加的な学習を行うことを目的として行われる場合もあると考えられる。このような追加的な学習を行うことを目的として、学習データの収集のため既存の著作物の複製等を行う場合、開発・学習段階においては上記イ(イ)のとおり、具体的事案に応じて、学習データの著作物の創作的表現を直接感得できる生成物を出力することが目的であると評価される場合は、享受目的が併存すると考えられる(後略)
もっとも、上記「考え方」の記載内容から明らかなように、これは先ほど説明した「学習目的による制限」の問題であり、海賊版特有の問題ではありません。
したがって、大規模な事前学習と小規模な追加学習・ファインチューニングを区別する必要があります。
まず、大規模なモデルの構築を行う場合に「学習用データに含まれる著作物の創作的表現の影響を強く受けた生成物が出力されるような追加的な学習を行うことを目的」(表現出力目的)があることは通常考えられないことから、この点が問題になることは少ないと思われます(図40)。

図40
一方、AI提供者やAI利用者の場合は、特定のキャラクターのみを出力するような追加学習を行うことを目的としている(表現出力目的)ことはありえるでしょう。そのような場合には、当該追加学習や、追加学習のための海賊版等の権利侵害複製物を掲載するウェブサイトからの収集・蓄積行為が著作権侵害となります(図41)。

図41
② 生成・利用段階における著作権侵害行為についてAI開発者等が規範的行為主体として責任を負う場合
2点目は、AI開発者が海賊版等のデータを利用してAIを作成して当該AIを公開した場合において、当該AIを利用して、AI利用者が著作権侵害行為(学習用データに含まれている著作物と同一・類似の著作物を生成して販売する行為)を行った場合です(図42)。

図42
この場合は、①の例外とは異なり、学習そのものが著作権侵害となる訳ではなく、あくまでAIで生成したAI生成物の利用により著作権侵害が発生した場合に、AI開発者が当該著作権侵害について規範的行為主体としての責任を負う可能性がある、ということです。
このように、生成・利用段階でAI利用者による著作権侵害行為が行われた場合において、当該AIの開発を行ったAI開発者が当該著作権侵害についても責任主体となるかの問題(規範的行為主体の問題)については、「第2・3」で詳細に説明しますが、考え方37頁では下記のとおりまとめられています。
① ある特定の生成 AI を用いた場合、侵害物が高頻度で生成される場合は、事業者が侵害主体と評価される可能性が高まるものと考えられる。
② 事業者が、生成 AI の開発・提供に当たり、当該生成 AI が既存の著作物の類似物を生成する蓋然性の高さを認識しているにも関わらず、当該類似物の生成を抑止する措置を取っていない場合、事業者が侵害主体と評価される可能性が高まるものと考えられる。
③ 事業者が、生成 AI の開発・提供に当たり、当該生成 AI が既存の著作物の類似物を生成することを防止する措置を取っている場合、事業者が侵害主体と評価される可能性は低くなるものと考えられる。
④ 当該生成 AI が、事業者により上記の(2)キ③の手段を施されたものであるなど侵害物が高頻度で生成されるようなものでない場合においては、たとえ、AI 利用者が既存の著作物の類似物の生成を意図して生成 AI にプロンプト入力するなどの指示を行い、侵害物が生成されたとしても、事業者が侵害主体と評価される可能性は低くなるものと考えられる。
つまり、AI開発者が規範的行為主体として生成・利用段階の著作権侵害について責任を負う可能性があるのは、①ある特定の生成 AI を用いた場合、侵害物が高頻度で生成される場合や、②生成 AI の開発・提供に当たり、当該生成 AI が既存の著作物の類似物を生成する蓋然性の高さを認識しているにも関わらず、当該類似物の生成を抑止する措置を取っていない場合に限られます。
例外①と同様、対象著作物が海賊版であるか否かは全く関係がありません。
(ⅲ)海賊版の利用についての「考え方」における記載
海賊版の利用についての「考え方」28頁~29頁の記載と、それに対する筆者の意見は以下のとおりです。
(考え方28頁)
○AI 開発事業者や AI サービス提供事業者が、ウェブサイトが海賊版等の権利侵害複製物を掲載していることを知りながら、当該ウェブサイトから学習データの収集を行ったという事実は、これにより開発された生成 AI により生じる著作権侵害についての規範的な行為主体の認定に当たり、その総合的な考慮の一要素として、当該事業者が規範的な行為主体として侵害の責任を問われる可能性を高めるものと考えられる(AI 開発事業者又は AI サービス提供事業者の行為主体性について、後掲(2)キも参照)。
この部分は、先ほどの例外②「生成・利用段階における著作権侵害行為についてAI開発者等が規範的行為主体として責任を負う場合」について説明している部分です。
しかし、AI 開発者等が生成・利用段階の著作権侵害について規範的行為主体として責任を負うのは、先ほど述べたように、「①ある特定の生成 AIを用いた場合、侵害物が高頻度で生成される場合や、②生成 AIの開発・提供に当たり、当該生成 AI が既存の著作物の類似物を生成する蓋然性の高さを認識しているにも関わらず、当該類似物の生成を抑止する措置を取っていない場合」に限られます。
そのような事情がない場合において、「(AI開発者等が)ウェブサイトが海賊版等の権利侵害複製物を掲載していることを知りながら、当該ウェブサイトから学習データの収集を行ったという事実」が、規範的行為主体性が認められる可能性を高める要素として働くとは考えにくいように思います。
(考え方28から29頁)
○ この点に関して、こうした海賊版等の権利侵害複製物を掲載するウェブサイトからの学習データの収集は、少量の学習データを用いて、学習データに含まれる著作物の創作的表現の影響を強く受けた生成物が出力されるような追加的な学習を行うことを目的として行われる場合もあると考えられる。このような追加的な学習を行うことを目的として、学習データの収集のため既存の著作物の複製等を行う場合、開発・学習段階においては上記イ(イ)のとおり、具体的事案に応じて、学習データの著作物の創作的表現を直接感得できる生成物を出力することが目的であると評価される場合は、享受目的が併存すると考えられるが、これに加えて、生成・利用段階においては、これにより追加的な学習を経た生成AIが、当該既存の著作物の創作的表現を含む生成物を生成することによる、著作権侵害の結果発生の蓋然性が認められる場合があると考えられる。
この部分のうち「~享受目的が併存すると考えられるが」までは、先ほどの例外①「開発・学習段階における著作物利用行為が著作権侵害となる場合」について説明している部分です。そして、この部分については、「AI開発段階で著作物の利用行為に表現出力目的がある場合には30条の4が適用されない」という当然のことを述べているに過ぎず、海賊版特有の問題ではありません。学習対象著作物が海賊版であることと、表現出力目的の有無は別問題だからです。
それに引き続く「これに加えて~」以下の部分は、考え方記載の通りだと思います。
(考え方29頁)
○ そのため、海賊版等の権利侵害複製物を掲載するウェブサイトからの学習データの収集を行う場合等に、事業者において、このような、少量の学習データに含まれる著作物の創作的表現の影響を強く受けた生成物が出力されるような追加的な学習を行う目的を有していたと評価され、当該生成AIによる著作権侵害の結果発生の蓋然性を認識しながら、かつ、当該結果を回避する措置を講じることが可能であるにもかかわらずこれを講じなかったといえる場合は、当該事業者は著作権侵害の結果発生を回避すべき注意義務を怠ったものとして、当該生成AIにより生じる著作権侵害について規範的な行為主体として侵害の責任を問われる可能性が高まるものと考えられる。
この部分は、例外②「生成・利用段階における著作権侵害行為についてAI開発者等が規範的行為主体として責任を負う場合」について説明している部分です。
もっとも、説明内容としては、先ほど「AI 開発者等が生成・利用段階の著作権侵害について規範的行為主体として責任を負う場合」として「考え方」37頁に記載されている内容とほぼ同一です。
すなわち、①ある特定の生成 AIを用いた場合、侵害物が高頻度で生成される場合や、②生成 AIの開発・提供に当たり、当該生成 AI が既存の著作物の類似物を生成する蓋然性の高さを認識しているにも関わらず、当該類似物の生成を抑止する措置を取っていない場合には、AI開発者等が規範的行為主体として責任を負う可能性がある、ということを少し言い換えただけであり、この部分も海賊版特有の問題について言及しているものではありません。
(ⅳ) 画像生成AI等のコンテンツ生成AIとテキスト生成AI
また、海賊版の論点との関係では、画像生成AI等のコンテンツ生成AIと、LLMのようなテキスト生成AIとを明確に区別することも重要です。
確かに、コンテンツ生成AIの場合、「考え方」に示されている要素を満たす、すなわち学習対象著作物である海賊版の表現出力目的がある収集・学習行為(開発・学習段階)や、学習対象著作物と類似・同一のAI生成物が生成・利用される(生成・利用段階)ことはあり得ます。
一方、LLMの様なテキスト生成AIの場合、表現出力目的を持った学習行為(開発・学習段階)や、学習対象著作物と類似・同一のAI生成物が生成・利用される(生成・利用段階)ことはほとんど考えられません。
したがって、AI開発者がLLMを開発するために、ウェブ上の大量のデータをクローリングしたり、公開されている学習用データセットを複数利用したところ、その一部の学習用データセットの中に海賊版のような権利侵害複製物が含まれていた場合であっても(あるいは、収集後事後的に権利者から警告を受けて、学習用データセットの中に権利侵害複製物が含まれていることを知ったとしても)、当該開発・学習行為が30条の4柱書但書により違法となったり、生成・利用段階の著作権侵害について規範的行為主体として責任を負うことは、ほぼあり得ないと考えます。
(ⅴ) 設例についての結論
以上を前提とすると、冒頭の事例におけるAI開発者の行為が著作権侵害に該当することはないと考えます。
(ウ) 学習禁止意思が付されている著作物
(ⅰ) 著作権侵害には該当しない
例えばウェブ上のイラスト等には「AI学習禁止」など、著作権者の学習禁止意思が付されている著作物がありますが、権利制限規定の趣旨及び30条の4の立法趣旨からすると、そのような意思表示があることによって30条の4の適用がない(あるいは30条の4の但書に該当する)と解釈することはできません2「考え方」25 頁〜26 頁。
したがって、著作権者の学習禁止意思が付されている著作物をAI学習のために利用したとしても著作権侵害には該当しません。また、学習禁止意思が付されているからといって30条4柱書但書に該当する可能性が高まるわけでもありません3パブコメ207 参照。
(ⅱ) 契約違反の可能性はある
一方、著作権者とAI開発者との間で「対象データをAI学習に利用しない」「利用する場合には所定の対価を支払う」等の契約が真正に成立している場合は、著作権侵害とは別の論点として、当該契約違反になるかという問題が生じます4諸外国では、このような契約を定めても法的強制力を持たないことを明文で定めている例もある(『AI と著作権法』46 頁〔上野〕、同56 頁。英国CDPA 第29A 条5項、欧州指令7条1項、シンガポール著作権法187 条1項)。。
この点については、以下の2点が問題となります5この点について詳細に検討しているものとして、新たな知財制度上の課題に関する研究会編「新たな知財制度上の課題に関する研究会報告書」31 頁以下。。
① そもそも著作権法上「著作権者の承諾なく行える」とされている行為(権利制限規定に該当する行為)を契約で制限することはできるのか
② ①が可能だとしてどのような場合に「契約が成立した」といえるのか
①の論点については、「有効説」と「無効説」があり、「無効説」も、「情報解析を禁じる契約は一律無効」とする説と「AI学習等のための著作物の利用行為を制限するオーバーライド条項は、その範囲において無効」とする説がありますが、どちらかというと「有効説」を唱える論者が多いという印象です6『AI と著作権法』247 頁〜255 頁。
もっとも、実務的には、むしろ②の論点の方が問題になる可能性が高いように思います。
まず、著作権者とAI開発者が個別に交渉して契約を締結した場合には「契約が成立した」と言えることは明らかです。
一方、単にウェブサイトに利用規約が表示され、そこに一方的に禁止条項が記載されているというだけでは「契約が成立した」と言えない可能性が高いと思われます。
難しいのは、そのような利用規約に同意ボタンが付され、ユーザは当該同意ボタンをクリックしないと当該ウェブサイトが利用できない、というケースです。
この点については、単に同意ボタンをクリックしたというだけで契約が成立したと自動的に解釈することはできず、30条の4の立法趣旨や、利用規約の性質(一方当事者が作成して交渉の余地もない)、本来自由な(著作権法で禁止されていない)行為についてあえて契約で禁止するという契約であることから、本当にそのような内容の契約が成立したのかは慎重に検討する必要があり、「契約が成立した」といえるかどうかはケースバイケースであるとする意見が多いように思います7『AI と著作権法』250 頁〜252 頁〔谷川・前田発言〕。
(ⅲ) 著作権侵害に該当するかと契約違反に該当するかは全く別問題
なお、言うまでもありませんが、仮に①の論点において有効説を採用し、かつ②の論点において有効に契約が成立しているとしても、それに違反した場合は単に債務不履行(契約違反)となるだけであって、著作権侵害になるわけではありません。
(エ) 学習を防止するための機械可読方法による技術的な措置が付されている著作物
(ⅰ)robots.txtやペイウォールのような技術的措置
考え方26頁では、「AI 学習のための著作物の複製等を防止するための、機械可読な方法による技術的な措置」として、以下のような措置を紹介しています。
(例)ウェブサイト内のファイル”robots.txt”への記述によって、AI 学習のための複製を行うクローラによるウェブサイト内へのアクセスを制限する措置
(例)ID・パスワード等を用いた認証によって、AI 学習のための複製を行うクローラによるウェブサイト内へのアクセスを制限する措置
諸外国の立法例では、「オンラインで公衆に利用可能とされるコンテンツのため機会により読み取り可能となる手段のような適切な方法で、同項にいう著作物や他の保護他対象物の使用を明示的に留保」している場合は権利制限の対象とならないとするものがあります(欧州DSM施令4条、ただし、研究組織または文化遺産機関による学術研究目的の情報解析については対象外) 。
日本の著作権法30条の4にはこのような限定はないことから、上記の様な技術的措置を回避して行われる情報解析も権利制限の対象となります8『AI と著作権』66 頁〔上野〕、266 頁〔奥邨発言〕9前掲の早稲田委員発言・澤田委員発言。なお、この点について「考え方」内に明確な記載はないようです。
「情報解析に活用できる形で整理したデータベースの著作物」のところで説明したように、上記の様な技術的措置が付されていることが「情報解析に活用できる形で整理したデータベースの著作物が将来販売される予定があること」を推認させる一事情にはなり得ますが、当該技術的措置の回避自体が30条の4柱書但書に該当するわけではありません。
(ⅱ)コピーコントロール/アクセスコントロール
技術的措置のうち、コピーコントロール/アクセスコントロールのような技術的措置については、著作権法上「技術的保護手段」(著作権法2条1項20号)や「技術的利用制限手段」(同21号)として特別な保護を与えられています。
例えば、「技術的利用制限手段」の回避(例:マジコンを用いたゲームのプレイ)については、原則として著作権侵害となります(法113条6項)10ただし「技術的利用制限手段に係る研究又は技術の開発の目的上正当な範囲内で行われる場合その他著作権者等の利益を不当に害しない場合」は適用外とされているため、情報解析のために行われる回避行為は基本的にこれに当たる場合が多いと思われる(『AI と著作権法』67 頁〔上野〕、前田健「生成AI における学習用データとしての利用と著作権」(有斐閣オンライン)。。
一方、このような「技術的保護手段」や「技術的利用制限手段」に該当しない技術的措置については、それを回避したからといって著作権侵害になることはありません。
考え方26頁では、以下のような記載がされており、robots.txtやペイウォールのような技術的措置が著作権法上の「技術的保護手段」又は「技術的利用制限手段」には該当しないことが明記されています11パブコメ213 では「著作権法第30 条の4ただし書きへの該当しうるケースとして、ゲームソフト等に施されている技術的手段に関しては特段の検討がなされていないことに鑑みるに、従来より技術的保護/利用制限手段に該当すると考えられてきたゲームソフト等に施されている技術的手段に関しては、それを回避等して行われる複製等が本条によって直ちに制限されるものではなく、ただし書きに該当する可能性が極めて高いと評価されているものと思料。本素案において、これを明記していただくとともに、現時点では技術的保護/利用制限手段に該当するかどうかは判然としない技術的手段であっても、権利者の意思を尊重し、著作物に施される技術的な制限を超えて、学習データとして収集されることのないよう、また、AI に活用されることの是非を明確に権利者が意思表示できるよう、当該技術ができる限り技術的保護/利用制限手段と評価されることを期待し、技術的保護/利用制限手段
に関する議論を進めていただくよう要望する。」という意見に対して「法第30 条の4の適用の有無と、技術的保護手段又は技術的利用制限手段該当性とは別個の問題であると考えられます。技術的保護手段又は技術的利用制限手段が施されている場合に、情報解析に活用できる形で整理されたデータベースの著作物が将来販売される予定があることが一定の蓋然性をもって推認されるか否かは、個別具体的な事案に応じて検討すべきものと考えられます。本考え方では、AI 学習のための複製を防止する技術的な措置が技術的保護手段又は技術的利用制限手段に該当するか否かについては、今後の技術の動向も踏まえ検討すべきものとされています」と回答している。。
なお、上記のような技術的な措置が、著作権法に規定する「技術的保護手段」又は「技術的利用制限手段」に該当するか否かは、現時点において行われている技術的な措置が、従来、「技術的保護手段」又は「技術的利用制限手段」に該当すると考えられてきたものとは異なることから、今後の技術の動向も踏まえ検討すべきものと考えられる。
(オ)ライセンスビジネスが展開されている場合
現行法下で30条の4柱書但書に該当する具体例として争いがないのは、第2で説明した「大量の情報を容易に情報解析に活用できる形で整理されたデータベースの著作物が販売されている場合に,当該データベースを情報解析目的で複製等する行為」のみです。
もっとも、情報解析用DB著作物以外の著作物でも、現実にライセンスや販売されているものは多数存在します。たとえば、情報解析用DB著作物に該当しない、新聞社の過去記事DBや、印刷用やウェブサイト掲載に利用するためのイラストや画像などもその一例です。
そのような、「情報解析用DB著作物」には該当しないが、ライセンス市場が形成されている(すでにライセンス・販売されている)著作物の学習についても、30条の4柱書但書に該当する可能性があるのでしょうか。
ここでは、以下の設例をもとに、その点について検討をします。
【設例】
① フォトストックサービスを提供するA社は、2000年の創業以来、大量の写真素材をWebで公開しつつ、同素材をライセンス販売していた。ライセンス契約の内容は、利用枚数に応じた従量課金制で、写真素材の利用目的の制限は特になかった。
② 当時、写真素材のライセンスを購入した利用者は、当該写真素材を専ら自らのコンテンツ(ウェブ記事等)の作成のためにのみ利用していた。
③ 2015年頃から、写真素材のライセンスを購入した利用者が、当該写真素材を、AIの学習用データセットに加工して機械学習に使う例が増え始めた。
④ それを知ったA社は、よい収益機会だと考え、ライセンス内容を変更して、通常のライセンスでは写真素材を機械学習目的に利用することを禁止し、写真素材を機械学習目的に利用する場合には追加ライセンス契約と追加料金の支払が必要とした。
⑤ その後、機械学習目的のための追加ライセンス申込が順調に相次ぎ、追加ライセンス収入はA社にとって重要な収益源となった。また、A社の成功を見た同業他社もA社に追随し、機械学習目的のための写真素材販売が行われる取引事例が増加した。
⑥ 第三者Yが、A社がWebで公開している写真素材を機械学習に用いる目的でクローリングにより大量に無断収集し、機械学習に利用した。
⑦ Yの行為は30条の4柱書但書に該当するか。
⑧ A社は、自社が保有する写真素材を利用した学習用データセット(情報解析用DB著作物)は販売しておらず、将来的に販売する予定もないものとする。
(ⅰ)問題の所在
設例においては、写真素材について、コンテンツ利用についてのライセンスビジネスに加えて、機械学習利用についてのライセンスビジネスを行っているA社が存在していた場合に、当該ライセンス対象である写真素材を機械学習目的で収集・利用することが30条の4柱書但書に該当するかが問題となっています。
ここでの問題を一般化すると、「非享受目的が本来的な利用目的ではない著作物(=享受目的が本来的な利用目的である著作物。設例における写真素材のこと)について、権利者が非享受目的の利用についてのライセンスビジネス(機械学習利用についてのライセンスビジネス)を展開している場合に、当該著作物を非享受目的(機械学習目的)で利用することは30条の4柱書但書に該当するか」という問題ということになります。
もともと、非享受目的が本来的な利用目的ではない著作物(=享受目的が本来的な利用目的である著作物)について、非享受目的利用をすることは30条の4本文により権利制限の対象となっています。そのような著作物についてライセンスビジネスが行われている場合において、ライセンスを受けずに無断で行う著作物利用行為が30条の4柱書但書に該当するかが問題となるのです。
なお、本設例においては「⑧ A社は、自社が保有する写真素材を利用した学習用データセットは販売しておらず、将来的に販売する予定もないものとする」としましたが、仮にA社が、自社が保有する写真素材を利用した学習用データセットを既に販売していたり、将来的に販売する予定がある場合は、A社としては当該学習用データセットを被侵害著作物とした著作権侵害の主張も可能です。
その場合、A社は「機械学習目的でのライセンスを行っている個々の写真素材」を被侵害著作物とした著作権侵害の主張と「機械学習目的でのライセンスを行っている学習用データセット」を被侵害著作物とした著作権侵害の主張の双方を主張可能ということになりますが、後者については既に述べたことが当てはまります。
(ⅱ)学説の状況
この問題について、学説においては以下のように限定的に肯定する説と否定する説があります。
① 限定的に肯定する説(限定肯定説)12松田政行編『著作権法コンメンタール別冊 平成30 年・令和2年改正解説』(勁草書房、2022)32 頁
同説は「非享受目的が当該著作物の本来的な利用目的ではないものの,非享受目的の利用についてのライセンスが提供されている場合に,ただし書に該当するかが問題となる。この点については,非享受目的の利用は権利制限の対象とされた利用態様であり,当該利用について著作権を及ぼして対価回収の機会を与える必要はないのであるから,ライセンスが提供されていることをもって,直ちにただし書に該当する著作権を及ぼすと考えることは妥当ではないと考えられる。もっとも,非享受目的のライセンス市場が発展し当該著作物について非享受目的の利用が本来的な利用と客観的に評価できるに至った場合には,そのライセンス市場と衝突するような利用については,ただし書に該当することもあり得るものと考える。この点については,提供されているライセンスの内容の合理性やライセンスの利用状況等も総合的に考慮して判断がなされるものと考える」と(強調部筆者)。
② 否定説
一方で、この点について否定する説もあります。
たとえば、愛知先生は「著作権侵害を構成しない行為について,余計な紛争・訴訟リスクや手間を避けるという理由などのために,本来は不要なはずのライセンスに応じるという取引慣行が一般化した既成事実それ自体が,非侵害行為を侵害行為に転化させる理由とはならない。13『AI と著作権』27 頁〔愛知〕」とし、前田健先生は「何が対価を収受すべき本来的利用に該当するかは、個々の著作権者の意図によって左右されるべきではなく、著作物の性質や一般的な取引の実情によって定まると考えるべきであろう。したがって、著作権者が非享受利用にかかるライセンスを事実上行っていたとしても(たとえば、音楽の著作権者がデータ解析をライセンスしていた場合)、ただし書適用の根拠にはならないと考える。14前田健「柔軟な権利制限規定の設計思想と著作権者の利益の意義」田村善之編著『知財とパブリックドメイン
第2巻 著作権法篇』(勁草書房、2023)208 頁」として否定説をとります。
(ⅲ) 検討
① 著作物の「市場」とは
通常、30条の4柱書但書の該当性を検討するに際しては、著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的販路を阻害するかという観点から、技術の進展や、著作物の利用態様の変化といった諸般の事情を総合的に考慮して検討することが必要とされています15「考え方」23 頁、「基本的な考え方」問9(9頁)。
この点については筆者も特に反対するものではありません。
しかし、ここでいう「著作権者の著作物の利用(将来における著作物の潜在的販路を含む、以下同じ)」における「市場」とは具体的に何を意味するのでしょうか。
ある著作物について何らかの取引があると言うことは、当該著作物に関する何らかの市場があるということを意味します。そのため、「著作権者の著作物の利用市場を害するか」を論じる際に「市場」の意味について具体的に検討しなければ、著作物のあらゆる態様での取引行為が、少なくとも潜在的販路を害することになり、その結果、但書の適用範囲が無限定になる可能性があります。
そのため「著作権者の著作物の利用市場」における「市場」の意味を特定・明確化する必要があることになります。
通常、著作物はその本来的利用行為である視聴等(=享受利用)されることを目的として制作され、享受利用が行われることを前提とした市場で取引されます。一方、例外的に、それ以外の目的、すなわち非享受利用されることを目的として制作され、非享受利用されることを前提とした市場で取引がされることもあります。後者の例としては、「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物が販売されている場合」が該当します。
そして「享受利用が行われることを前提とした市場(以下「享受利用市場」という)」と「非享受利用が行われることを前提とした市場(以下「非享受利用市場」という)」とでは、需要者・供給者の層や規模、取引メカニズム等が全く異なります。前者はいわゆるコンテンツ市場であるのに対し、後者は主に技術開発や情報解析等技術的な財を利用した技術開発等を目的として取引が行われる市場だからです。
したがって、ある著作物の利用行為が、「著作権者の著作物の利用市場」と衝突・阻害するかを検討するに際しては、この2種類の市場を区別して検討する必要があるでしょう16柿沼太一「生成AI と著作権」知財ぶりずむ21 巻248 号(2023)17 頁。
これを整理したのが以下の表 3です。
著作物を「享受利用されることを本来目的として制作された著作物」と「非享受利用されることを本来目的として制作された著作物」に分け、それぞれを「無許諾での享受目的利用」「無許諾での非享受利用」した場合、2つの市場のいずれと衝突するかを示しています。

表3
このうち、「享受利用されることを本来目的として制作された著作物」について「無許諾での享受目的利用」を行うことは当然享受目的市場と衝突します。その結果、当該行為には30条の4は適用されず、他の権利制限規定の適用がなければ著作権侵害に該当します(表4)。「学習目的による制限」のところで説明した、情報解析目的の著作物利用行為に「表現出力目的」が併存しているケースもこれに該当します。

表4
次に、著作物について無許諾での非享受目的利用を行うことは、30条の4柱書が適用される行為です(表5)。

表5

表6
限定肯定説は、「非享受目的のライセンス市場が発展し当該著作物について非享受目的の利用が本来的な利用と客観的に評価できるに至った場合には,そのライセンス市場と衝突するような利用については,ただし書に該当することもあり得る」とします。
これを図示すると以下のように、一定の要件を満たした場合に30条4柱書但書該当行為を「拡大」することを意味することになります。

表7
私見としては、否定説が妥当と考えます。
その理由は否定説の論者が主張するとおりですが、さらに限定肯定説が主張する基準である「非享受目的のライセンス市場が発展し当該著作物について非享受目的の利用が本来的な利用と客観的に評価できるに至った場合」のような曖昧な基準で、30条の4が適用され本来適法である行為が、将来的な事情の変化により違法に転じるとなると、AI学習に際して著作物の利用行為に過度な萎縮効果をもたらすという点が挙げられます。
また、著作権者が独占すべき著作物市場のうち、「非享受利用市場」を独占するためには、非享受利用されることを本来目的として制作された著作物についての非享受利用が30条の4柱書但書に該当するとすれば足ります。
限定肯定説は、一定の条件を満たした場合は、この「非享受利用市場」自体を拡大することを説くものですが、そのような解釈は著作物の保護と利用のバランスを欠くものとなるのではないでしょうか。
たとえば、設例におけるA社としては、写真素材を使って情報解析用のDB著作物を制作して販売(ライセンス)すれば、仮に当該DB著作物を無断利用した者がいた場合に権利行使できますし、かつそれに加えて、写真素材の享受目的の無断利用についても当然権利行使できるのですから、A社の保護としては十分と思われます。
以上の理由から、設例におけるYの行為には30条の4柱書但書は適用されず、適法と考えます。
脚注一覧
- 1ただし、「考え方」28 頁には「AI 開発事業者やAI サービス提供事業者においては、学習データの収集を行うに際して、海賊版を掲載しているウェブサイトから学習データを収集することで、当該ウェブサイトへのアクセスを容易化したり、当該ウェブサイトの運営を行う者に広告収入その他の金銭的利益を生じさせるなど、当該行為が新たな海賊版の増加といった権利侵害を助長するものとならないよう十分配慮した上でこれを行うことが求められる。」との記載があり、パブコメ266 等においては「このような助長行為があった場合、個別具体的な事案によっては、侵害行為の幇助となる場合もあると考えられます。」と記載されている。
- 2「考え方」25 頁〜26 頁
- 3パブコメ207 参照
- 4諸外国では、このような契約を定めても法的強制力を持たないことを明文で定めている例もある(『AI と著作権法』46 頁〔上野〕、同56 頁。英国CDPA 第29A 条5項、欧州指令7条1項、シンガポール著作権法187 条1項)。
- 5この点について詳細に検討しているものとして、新たな知財制度上の課題に関する研究会編「新たな知財制度上の課題に関する研究会報告書」31 頁以下。
- 6『AI と著作権法』247 頁〜255 頁
- 7『AI と著作権法』250 頁〜252 頁〔谷川・前田発言〕
- 8『AI と著作権』66 頁〔上野〕、266 頁〔奥邨発言〕
- 9前掲の早稲田委員発言・澤田委員発言
- 10ただし「技術的利用制限手段に係る研究又は技術の開発の目的上正当な範囲内で行われる場合その他著作権者等の利益を不当に害しない場合」は適用外とされているため、情報解析のために行われる回避行為は基本的にこれに当たる場合が多いと思われる(『AI と著作権法』67 頁〔上野〕、前田健「生成AI における学習用データとしての利用と著作権」(有斐閣オンライン)。
- 11パブコメ213 では「著作権法第30 条の4ただし書きへの該当しうるケースとして、ゲームソフト等に施されている技術的手段に関しては特段の検討がなされていないことに鑑みるに、従来より技術的保護/利用制限手段に該当すると考えられてきたゲームソフト等に施されている技術的手段に関しては、それを回避等して行われる複製等が本条によって直ちに制限されるものではなく、ただし書きに該当する可能性が極めて高いと評価されているものと思料。本素案において、これを明記していただくとともに、現時点では技術的保護/利用制限手段に該当するかどうかは判然としない技術的手段であっても、権利者の意思を尊重し、著作物に施される技術的な制限を超えて、学習データとして収集されることのないよう、また、AI に活用されることの是非を明確に権利者が意思表示できるよう、当該技術ができる限り技術的保護/利用制限手段と評価されることを期待し、技術的保護/利用制限手段
に関する議論を進めていただくよう要望する。」という意見に対して「法第30 条の4の適用の有無と、技術的保護手段又は技術的利用制限手段該当性とは別個の問題であると考えられます。技術的保護手段又は技術的利用制限手段が施されている場合に、情報解析に活用できる形で整理されたデータベースの著作物が将来販売される予定があることが一定の蓋然性をもって推認されるか否かは、個別具体的な事案に応じて検討すべきものと考えられます。本考え方では、AI 学習のための複製を防止する技術的な措置が技術的保護手段又は技術的利用制限手段に該当するか否かについては、今後の技術の動向も踏まえ検討すべきものとされています」と回答している。 - 12松田政行編『著作権法コンメンタール別冊 平成30 年・令和2年改正解説』(勁草書房、2022)32 頁
- 13『AI と著作権』27 頁〔愛知〕
- 14前田健「柔軟な権利制限規定の設計思想と著作権者の利益の意義」田村善之編著『知財とパブリックドメイン
第2巻 著作権法篇』(勁草書房、2023)208 頁 - 15「考え方」23 頁、「基本的な考え方」問9(9頁)
- 16柿沼太一「生成AI と著作権」知財ぶりずむ21 巻248 号(2023)17 頁
この記事の内容を、対話形式の音声で聞くことができます。
▶ 対話形式で聞く
※ 対話形式の音声はNotebookLMを利用して自動的に作成したものです。正確な内容は記事本文をご参照ください。