人工知能(AI)、ビッグデータ法務 著作権
AIと著作権【第5回】開発・学習段階での著作権侵害行為が発生した場合、侵害者はどのような責任を負うか
2025年7月にSTORIA法律事務所の柿沼・杉浦の共著で日本加除出版から書籍「AIと法 実務大全」を出版します。
本書は650頁超というボリュームでありながらも、AI開発や利活用に問題となる点を「網羅的」に解説するものではありません。あくまで、現場の方がAI開発や利活用を行う際に、法律的によく問題となる論点とその解決手法に照準を絞っています。その分個々の論点については、最先端の議論を下敷きにしつつ実務的に相当深掘りした記述となっています。
書籍の出版に先立ち、その一部である「第2章 生成AI開発・提供・利用と著作権」について日本加除出版からご了解を得て、ブログで連載記事として先行公開することとしました。
「一部」といっても記事合計13万字を越えるボリューム(ほぼ新書1冊分!)であり、ブログ公開を快諾いただいた日本加除出版には感謝しかありません。
この連載記事を読んで興味が湧いた方は是非書籍をお買い求めください!
連載「AIと著作権」全18回の目次を表示
- 第1回 プレイヤー・フェーズ・提供形態による法的整理
- 第2回 AI学習段階での著作物利用はどこまで許されるか?──著作権法第30条の4の射程
- 第3回 学習用データとして“何を使ってはいけないか”を見極める~学習対象の観点からの検討~
- 第4回 海賊版や学習禁止表示がされている著作物をAI学習に利用することができるか
- 第5回 開発・学習段階での著作権侵害行為が発生した場合、侵害者はどのような責任を負うか
- 第6回 生成・利用段階では何が問題になるのか?
- 第7回 類似AI生成物の「生成」における依拠性をどのように考えるか~複雑な論点を解きほぐす~
- 第8回 類似AI生成物の「生成」における行為主体性~ロクラクⅡ事件判決をベースに徹底的に考える~
- 第9回 生成された類似AI生成物を利用すると著作権侵害?
- 第10回 類似AI生成物の「送信」は誰の責任?──クラウド提供型AIにおける著作権侵害リスクを検証する
- 第11回 生成・利用段階で著作権侵害行為が認められた場合、権利者は何を請求できるのか
- 第12回 RAG・ロングコンテクストLLMと著作権侵害(前編)
- 第13回 RAG・ロングコンテクストLLMと著作権侵害(後編)
- 第14回 RAGシステムのための既存著作物の蓄積・入力などは著作権侵害になるのか
- 第15回 RAGとAI利用者の責任~入力・送信・出力のそれぞれで何が問われるか?~
- 第16回 AI生成物に著作権はあるのか?~著作物性と“創作的寄与”の最新実務論~
- 第17回 その行為に日本著作権法は適用されるか~準拠法の問題~
- 第18回 で、結局何に気をつければよいのか~AI開発者・AI提供者・AI利用者それぞれの注意事項~
🔊 音声で内容を復習する
この記事の内容を、対話形式の音声で聞くことができます。
▶ 対話形式で聞く
※ 対話形式の音声はNotebookLMを利用して自動的に作成したものです。正確な内容は記事本文をご参照ください。
Contents
エ 開発・学習段階での著作権侵害行為が発生した場合、侵害者はどのような責任を負うか
まず、一般論として著作権侵害が生じた場合に、権利者が侵害者に対して民事上請求できる内容は以下のとおりです。
(1) 損害賠償請求(民法第 709 条)
文字通り、権利者が被った損害について賠償することを求めるものです。損害賠償請求が認められるには、侵害者の故意・過失が必要です。
(2) 差止請求(侵害行為の停止又は予防の請求(法第 112 条第1項)
侵害停止請求(現に行われている侵害行為の停止を求める)と、侵害予防請求(侵害のおそれのある場合に侵害行為の予防を求める)の2つがあります。
侵害者の故意・過失は必要ありません。(3)侵害の行為を組成した物、侵害の行為によって作成された物又は専ら侵害の行為に供された機械若しくは器具の廃棄その他の侵害の停止又は予防に必要な措置(同条2項)
(2)の差止請求に付随して行うことができます。
具体的には、侵害の行為を組成した物、侵害の行為によって作成された物(たとえば、無断で複製された書籍そのもの)又は専ら侵害の行為に供された機械若しくは器具(たとえば、無断複製を行うためのネガフィルム、写真用原版など)の廃棄その他の措置を請求することができます。
開発・学習段階での著作権侵害行為が発生し、それによって権利者が損害を被った場合、権利者が侵害者に対して損害賠償請求ができるのは当然のことです。
そして、何度も説明してきたとおり、生成AIにおいては、AI開発者・AI提供者・AI利用者いずれもが、その規模は異なれど、開発・学習段階での著作物利用行為を行うため、同段階での著作権侵害行為を行う可能性があります。
すなわち、ここでいう「侵害者」には大規模開発を行うAI開発者や、より小規模な追加学習等を行うAI提供者・AI利用者のいずれもが含まれる可能性があるということになります。
また、権利者や被疑侵害者にとっては、損害賠償請求に加えて上記(2)差止請求(112条1項) や(3)必要措置請求(112条2項)としてどのような請求が認められるか、という点も非常に重要な論点です。
特に、必要措置請求には「(将来の)侵害の予防に必要な措置の請求」という、非常に広範囲な内容が含まれているため、具体的にどのような請求が認められるかが問題となります。
「考え方」では29頁~30頁においてこの論点について検討していますが、そこで必要措置請求として検討対象となっているのは「① 将来の AI 学習に用いられる学習用データセットからの除去の請求」「② 学習済みモデルの廃棄請求」「③ 学習に用いられた特定の著作物による学習済モデルへの影響を取り除く措置の請求(例えば特定の学習用データを学習用データセットから除去した状態で再度学習済モデルの作成を行うなど)」の3つですので、本書でもその3つについて検討します。
ちなみに、ここで検討しているのは、あくまで「開発・学習段階での著作権侵害行為」があった場合にAI開発者等がどのような責任を負うかであり、「生成・利用段階での著作権侵害行為」があった場合に、規範的行為主体としてのAI開発者等がどのような責任を負うか、ではありませんから注意してください。
(ア) 将来の AI 学習に用いられる学習用データセットからの除去の請求
著作権侵害の対象となった当該著作物が、将来において AI 学習に用いられることに伴い、複製等の侵害行為が新たに生じる蓋然性が高いといえる場合は、当該 AI 学習に用いられる学習用データセットからの当該著作物の除去が、必要措置請求として認められる可能性があります1「考え方」29 頁。
もっとも、当該請求は、あくまで当該侵害行為を行った(訴訟において被告となっている)AI開発者等(たとえば、表現出力目的を持って学習行為を行ったために、当該学習行為に30条の4が適用されないAI開発者等)に対してしか認められません。
すなわち、そのような侵害行為を行っていないAI開発者(たとえば、表現出力目的を持たずに学習したAI開発者)に対しても同じ請求が認められる訳ではありません。
(イ) 学習済みモデルの廃棄請求
仮に開発・学習段階における著作権侵害を根拠として、学習済みモデルの廃棄が認められることとなると、AI開発者・提供者に与える影響は極めて大きくなります。
この点、法第 112 条第2項では、「侵害の行為を組成した物、侵害の行為によつて作成された物又は専ら侵害の行為に供された機械若しくは器具」を廃棄請求の対象として定めていますので、学習済みモデルがこれらの「侵害の行為を組成した・・器具」に該当するかが問題となります。
通常、AI 学習により作成された学習済モデルは、学習に用いられた著作物の複製物とはいえないことから、「侵害の行為を組成した物」又は「侵害の行為によつて作成された物」には該当しないと考えられます。また、通常、AI 学習により作成された学習済モデルは、学習用データである著作物と類似しないものを生成することができると考えられることから、「専ら侵害の行為に供された機械若しくは器具」にも該当しないと考えられます。
したがって、仮に開発・学習段階における著作権侵害があったとしても、原則として学習済みモデルは「侵害の行為を組成した・・・・器具」に該当しないことから、廃棄請求は認められません2以上について「考え方」30 頁。
もっとも、表現出力目的で学習するなど特殊な学習が行われることによって、当該学習済モデルが、学習用データである著作物と類似性のある生成物を高確率で生成する状態にある等の場合は、当該モデルが、法的には学習用データである著作物の複製物であると評価される場合も考えられます。
そのような例外的な場合には、学習済みモデルが「侵害の行為を組成した物」「侵害の行為によつて作成された物」又は「専ら侵害の行為に供された機械若しくは器具」として廃棄請求が認められる場合もありえます3「考え方」30 頁。
(ウ)学習に用いられた特定の著作物による学習済モデルへの影響を取り除く措置の請求
また、学習に用いられた特定の著作物による学習済モデルへの影響を取り除く措置の請求(例えば特定の学習用データを学習用データセットから除去した状態で再度学習済モデルの作成を行うなど)については、理論的には112条2項の「その他の侵害の停止又は予防に必要な措置」に該当する可能性があります。
しかし、現時点では、その技術的な実現可能性や、技術的に可能としてもこれに要する時間的・費用的負担の重さ等(例えば特定の学習用データを学習用データセットから除去した状態で再度学習済モデルの作成を行う場合、当初の学習と同程度の時間的・費用的負担が生じると考えられます。)から、通常、このような措置の請求は認められないと考えられます4「考え方」30 頁脚注39。
以上をまとめると以下の図43のとおりとなります。

図43
(3) 学習用データセットの公開(パターン2)
AI開発においては、学習済みモデルだけではなく学習用データセット(学習用DS)を公開することも多々ありますが、以下のような質問をよく受けます。
Web上のデータやDSを大規模に収集して学習用DS及び生成AIを構築し、学習用DSとAIを公開したところ、学習用DSは収集対象となったデータやDSがそのまま含まれていることから著作権侵害になるのではないかという指摘があった。どのように考えればよいか。
これは、学習済みモデル作成のための著作物利用行為が著作権侵害に該当するか、とは別に、学習用データセットの公開や譲渡が著作権侵害にならないかという問題です(図44)。

図44
ア 原則
学習用DSの中には、収集対象になったデータ(著作物)がそのままの形式で、あるいは若干加工した形で含まれているため、当該DSの公開や提供は、当該DSの中に含まれている著作物やその加工物(二次的著作物)の公衆送信行為や譲渡行為に該当します。
したがって、学習用DSの公開や提供に際しては、原則として元のデータ(著作物)の著作権者の承諾が必要です。
しかし、著作権法30条の4は「情報解析(略)の用に供する場合」には「その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる」と定めているため、他人のために学習用DSを作成することや、同DSの公開も同条により適法となります。
実は著作権法30条の4の前身である改正前著作権法47条の7は「著作物は、電子計算機による情報解析(略)を行うことを目的とする場合には、必要と認められる限度において、記録媒体への記録または翻案(これにより創作した二次的著作物の記録を含む)を行うことができる。(以下略)」と定めていました。
つまり、著作権法30条の4が施行されるまでは、他人による情報解析のための著作物の利用や、作成したデータセットの公衆送信や譲渡は認められていなかったのです。この点は、著作権法改正前の段階で、AI開発における大きな課題としてAI関係者の間では認識されていました。
しかし、著作権法30条の4が「情報解析(略)の用に供する場合」には「その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる」と定めたことにより、「自らのために作成したデータセットの共有」及び「他人のために作成したデータセットの共有」も適法となったのです。
この点は、著作権法30条の4の施行によって大きく変わった部分です。
以下は文化庁の「デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方(著作権法30条の4,47条の4及び47条の5関係)」 の該当部分であり、学習用DSの公開が著作権法30条の4により適法になることが明記されています5なお、著作権法47 条の7でも、同法30 条の4の規定の適用を受けて作成された複製物を譲渡により公衆に提供することができる旨が定められている。本文に記載したとおり、学習用データセット等の複製物の譲渡は法30 条の4で認められているが、47 条の7で定めておかないと、30 条の4の規定の適用を受けて作成された複製物の譲渡が権利制限の対象となっていないとの反対解釈を招くことから47 条の7で確認的に規定されたものとされている(加戸守行『著作権法逐条講義(七訂新版)』(著作権情報センター、2021)429 頁)。
問 11 人工知能の開発に関し、人工知能が学習するためのデータの収集行為、人工知能の開発を行う第三者への学習用データの提供行為は、それぞれ権利制限の対象となるか。
【回答】
(前略)
また、収集した学習用データを第三者に提供する行為についても、当該学習用データの利用が人工知能の開発という目的に限定されている限りは、「著作物に表現された思想または感情を享受」することを目的としない著作物の利用に該当し、法30条の4による権利制限の対象となるものと考えられる。
したがって、学習用データセットの公開・提供・販売については原則として著作権法30条の4が適用され適法です。
イ 例外
もっとも、これまで説明してきたように、AIモデル学習に際して表現出力目的が存在する場合は、当該学習のための著作物利用行為(学習用データセットの作成・譲渡・公開等を含む)については、30条の4が適用されません。
したがって、表現出力目的の学習に用いるための学習用データセット(たとえば、特定の著作権者の著作物のみで構成されている追加学習用データセット)の譲渡や公開については30条の4が適用されず、他の権利制限規定が適用されない限り、その譲渡・公開(公衆送信や譲渡)は、著作権侵害に該当することになります。
(4) 学習済みモデルの公開(パターン3)
学習済みモデル作成のための著作物利用行為が著作権侵害に該当するか、とは別に、学習済みモデル自体の公開・譲渡が著作権侵害にならないかも問題となります(図45)。

図45
ア 原則
学習用データセットと異なり、学習済みモデルの中に、学習に用いられたデータ(著作物)の創作的表現が残っていることは通常ありません。
したがって、学習済みモデルは学習に用いられた著作物の二次的著作物とは評価できず、原則として、学習済みモデルの公開・譲渡行為そのものが著作権侵害に該当することはないと考えられます。
イ 例外
もっとも、表現出力目的で学習するなど特殊な学習が行われることによって、当該学習済モデルが、学習用データである著作物と類似性のある生成物を高確率で生成する状態にある等の場合は、学習用データである著作物の創作的表現が当該学習済モデルに残存しているとして、当該モデルが法的には学習用データである著作物の複製物であると評価される場合も考えられます6「考え方」30頁。
その場合は、当該学習済みモデルの譲渡は著作権侵害に該当することとなり(表現出力目的があることから30条の4も適用されません)、先述のように、当該著作権侵害に対する権利者の措置請求(112条2項)として、当該学習済みモデルの廃棄請求が認められる可能性があると思われます。
脚注一覧
- 1「考え方」29 頁
- 2以上について「考え方」30 頁
- 3「考え方」30 頁
- 4「考え方」30 頁脚注39
- 5なお、著作権法47 条の7でも、同法30 条の4の規定の適用を受けて作成された複製物を譲渡により公衆に提供することができる旨が定められている。本文に記載したとおり、学習用データセット等の複製物の譲渡は法30 条の4で認められているが、47 条の7で定めておかないと、30 条の4の規定の適用を受けて作成された複製物の譲渡が権利制限の対象となっていないとの反対解釈を招くことから47 条の7で確認的に規定されたものとされている(加戸守行『著作権法逐条講義(七訂新版)』(著作権情報センター、2021)429 頁)
- 6「考え方」30頁
この記事の内容を、対話形式の音声で聞くことができます。
▶ 対話形式で聞く
※ 対話形式の音声はNotebookLMを利用して自動的に作成したものです。正確な内容は記事本文をご参照ください。