ブログ/ BLOG

  1. ホーム
  2. ブログ
  3. 人工知能(AI)、ビッグデータ法務
  4. AIと著作権【第1回】 プレイヤー・フェーズ・提供形態による法的整理|知的財産・IT・人工知能・ベン…

人工知能(AI)、ビッグデータ法務 著作権

AIと著作権【第1回】 プレイヤー・フェーズ・提供形態による法的整理

アバター画像 柿沼太一


 2025年7月にSTORIA法律事務所の柿沼・杉浦の共著で日本加除出版から書籍「AIと法 実務大全」を出版します。
 本書は650頁超というボリュームでありながらも、AI開発や利活用に問題となる点を「網羅的」に解説するものではありません。あくまで、現場の方がAI開発や利活用を行う際に、法律的によく問題となる論点とその解決手法に照準を絞っています。その分個々の論点については、最先端の議論を下敷きにしつつ実務的に相当深掘りした記述となっています。
 書籍の出版に先立ち、その一部である「第2章 生成AI開発・提供・利用と著作権」について日本加除出版からご了解を得て、ブログで連載記事として先行公開することとしました。
 「一部」といっても記事合計13万字を越えるボリューム(ほぼ新書1冊分!)であり、ブログ公開を快諾いただいた日本加除出版には感謝しかありません。
 この連載記事を読んで興味が湧いた方は是非書籍をお買い求めください!

連載「AIと著作権」全18回の目次を表示
  1. 第1回 プレイヤー・フェーズ・提供形態による法的整理
  2. 第2回 AI学習段階での著作物利用はどこまで許されるか?──著作権法第30条の4の射程
  3. 第3回 学習用データとして“何を使ってはいけないか”を見極める~学習対象の観点からの検討~
  4. 第4回 海賊版や学習禁止表示がされている著作物をAI学習に利用することができるか
  5. 第5回 開発・学習段階での著作権侵害行為が発生した場合、侵害者はどのような責任を負うか
  6. 第6回 生成・利用段階では何が問題になるのか?
  7. 第7回 類似AI生成物の「生成」における依拠性をどのように考えるか~複雑な論点を解きほぐす~
  8. 第8回 類似AI生成物の「生成」における行為主体性~ロクラクⅡ事件判決をベースに徹底的に考える~
  9. 第9回 生成された類似AI生成物を利用すると著作権侵害?
  10. 第10回 類似AI生成物の「送信」は誰の責任?──クラウド提供型AIにおける著作権侵害リスクを検証する
  11. 第11回 生成・利用段階で著作権侵害行為が認められた場合、権利者は何を請求できるのか
  12. 第12回 RAG・ロングコンテクストLLMと著作権侵害(前編)
  13. 第13回 RAG・ロングコンテクストLLMと著作権侵害(後編)
  14. 第14回 RAGシステムのための既存著作物の蓄積・入力などは著作権侵害になるのか
  15. 第15回 RAGとAI利用者の責任~入力・送信・出力のそれぞれで何が問われるか?~
  16. 第16回 AI生成物に著作権はあるのか?~著作物性と“創作的寄与”の最新実務論~
  17. 第17回 その行為に日本著作権法は適用されるか~準拠法の問題~
  18. 第18回 で、結局何に気をつければよいのか~AI開発者・AI提供者・AI利用者それぞれの注意事項~

▶ AIと著作権 連載全体の目次ページはこちら

🔊 音声で内容を復習する

この記事の内容を、対話形式の音声で聞くことができます。
▶ 対話形式で聞く

※ 対話形式の音声はNotebookLMを利用して自動的に作成したものです。正確な内容は記事本文をご参照ください。


1 生成AI開発・提供・利用と著作権

(1) 分析の視点

 生成AI開発・提供・利用と著作権に関する論点は多岐にわたりますが、以下の3つの視点で整理をするとわかりやすいのではないかと思います。
 ① プレイヤー(「AI開発者」「AI提供者」「AI利用者」)
 ② フェーズ(「開発・学習段階」「生成・利用段階」)
 ③ システム・サービスの内容(「クラウド」「ローカル」)

ア プレイヤー

 AIの開発から利用までを時系列順に並べると、①AIの開発・提供、②開発されたAIを利用したAIサービスの開発・提供、③提供されたAIサービスの利用という順になります(図1)。
 

図1

 各行為を行うのが「AI開発者」「AI提供者」「AI利用者」です(①プレイヤー)。本書冒頭でお伝えしたとおり、1つのプレイヤーが複数の役割を兼ねること(たとえば「AI提供者」がAI開発を行う)もあります。

イ フェーズ

 そして、それぞれのプレイヤーによって「AIの開発・学習」段階の行為と「AI生成物の生成・利用」段階の行為の一方、あるいは双方が行われます(図 2、②フェーズ)。

図2

ウ システム・サービスの内容

 さらに、AIシステム・サービスは、AI利用者に対するクラウドサービスとして提供される場合もありますし、AI利用者自身がローカル環境1ここでいう「ローカル」には、AI利用者自身が管理するクラウド環境も含む。でAI生成物を生成・利用することもあります(③システム・サービスの内容)。下の図 3は、AIシステムがAI利用者に対するクラウドサービスとして提供されている場合を示したものです。
 

図3

エ ポイント

 ここでのポイントは「① プレイヤー(「AI開発者」「AI提供者」「AI利用者」)」と「② フェーズ(「開発・学習段階」「生成・利用段階」)」は一対一対応ではないということです。
 すなわち「AI開発者=開発・学習のみ行う、AI利用者=生成・利用のみ行う」という対応関係にあるわけではありません。
 いくつかのパターンを見ていきましょう。
 最もシンプルなパターンは「AI開発者」と「AI利用者」のみが登場し、「AI開発者」は「AIの開発・学習」のみを、「AI利用者」は「AI生成物の生成・利用」のみを行うパターンです(図 4)。
 

図4

 これは、「AI開発者」が開発したAI(学習済みモデル)を「AI利用者」に提供し、AI利用者が自らの手元で(ローカルで)当該AIを利用して「AI生成物の生成・利用」を行うパターンです。
 このパターンでは、「AI開発者=開発・学習のみ行う、AI利用者=生成・利用のみ行う」という対応関係にあります(図 5)。

図5

 

 次に、「AI開発者」と「AI利用者」のみが登場し、「AI開発者」は「AIの開発・学習」を、「AI利用者」は「AIの開発・学習」と「AI生成物の生成・利用」を行うパターンがあります。たとえば、AI開発者が開発した大規模なAIを入手したAI利用者が、自ら収集した小規模なデータで追加学習を行った上で、当該追加学習済みモデルを利用する場合などです(図6)。
 

図6

 このパターンにおいては、AI開発者は「開発・学習行為」のみを行い、AI利用者は「開発・学習行為」と「生成・利用行為」の両方を行っています(図 7)。
 

図7

 最後に「AI開発者」「AI提供者」が「AIの開発・学習」を、「AI利用者」が「AIの開発・学習」と「AI生成物の生成・利用」をそれぞれ行う場合(いわばフルコース)です(図8)。
 

図8

 このパターンにおいては、AI開発者とAI提供者は「開発・学習行為」のみを行い、AI利用者が「開発・学習行為」と「生成・利用行為」の両方を行っています(図9)。
 

図9

 生成AI開発・提供・利用と著作権の問題について検討する際には、このように基本的には「プレイヤー」×「フェーズ」の組み合わせで分析することになります。
 図7や図9のように、フェーズとして「開発・学習段階」や「生成・利用段階」が複数組み合わさることもありますが、基本的に各フェーズにおける著作権侵害の有無の考え方は同一です(ただし、AI提供者やAI利用者が行う「(追加)学習」は少量の学習用データで行うことが多く、その際には後述の学習目的による制限がかかることもあります)。
 また、先ほどの図5,7,9では、「AI開発者」が開発したAIを「AI利用者」に提供し、AI利用者が自らの手元で(ローカル環境で)当該AIを利用して「AI生成物の生成・利用」を行うパターンでしたが、実際には、AIがAI開発者・AI提供者からAI利用者に対して、クラウド上のサービスとして提供されている場合もあります(むしろ実際にはこのパターンの方が多いかもしれません)。
 この場合は以下の図のとおりになります(図 10)。
 

図10

 先ほどの図5,7,9との違いは、「生成・利用」段階の各行為を物理的に誰が行っているのか、という点です。
 先ほどの図5,7,9は、「生成・利用」を物理的に行っているのはAI利用者ですが、図10では、物理的に見ると、「生成・利用」のうち「入力」はAI利用者、AI生成物の「生成」はAI開発者、生成したAI生成物の「送信」はAI開発者、送信されたAI生成物の「利用」はAI利用者が行っています。
 このように、物理的に誰がどのような行為を行っているかを細かく分解することは、AI生成物の「生成・利用」について、AI開発者が著作権法上どのような責任を負うかを考えるに際して重要なポイントとなります。

(2) 「開発・学習」段階と「生成・利用」段階の意味

 本書では、「開発・学習」段階と「生成・利用」段階という用語について、以下の図 11の意味で用いています。
 

図11

 つまり、AIを開発するための行為が行われるフェーズを「開発・学習」段階、開発されたAIを用いて実際にAI生成物が生成されるフェーズを「生成・利用」段階と呼んでいます。
 したがって、ここでいう「学習」とは、機械学習技術を用いて、AI内のパラメータを物理的に更新する行為を指します。
 一方、「学習」には上記の意味での「学習」に加えて、いわゆるIn-Context Learning(ICL)の意味でも用いられることがあります。
 ICLとは、AIへ入力するプロンプトとして、① 指示文(質問文)と共に、② 出力生成の際に参考にさせたいデータや、理想的な入出力例のデータを同時に追加入力することで、出力精度を上げる手法です(そのような追加データを全く入力しない手法をZero-shot Learning、1つだけ与える手法をOne-shot Learning、いくつか与える手法をFew-shot Learningと言います。)2たとえばテキスト生成AI への入力プロンプトとして「……について説明してください。その際には以下の資料を参考にしてください。#資料1#資料2」のように、指示文とともに、正確な出力生成に必要な文書等のデータを同時に入力する方法がICL である。  ファインチューニングを含めた学習の場合、学習のためにかなりの量の学習用データが必要ですし、ファインチューニングしたからといって必ず精度向上が保証されるわけではありませんが、ICLの場合、いくつかの追加データを同時入力することで精度の高い出力を生成することができるというメリットがあると言われています。
 もっともICLにおいては、AI内のパラメータが物理的に更新されるわけではありませんので本書における「学習」には該当しません。ICLは「開発・学習段階」ではなく、「生成・利用段階」で行われる行為です。
 一方、文化審議会著作権分科会法制度小委員会が令和6年3月15日に公表した「AIと著作権に関する考え方について」(以下「考え方」)においては、「開発・学習段階における著作物の利用行為」として「検索拡張生成(RAG)等において、生成 AI への指示・入力に用いるためのデータベースの作成」が挙げられています(「考え方」18頁)。
 RAGにおいてはICLの技術が用いられていますが(詳細は後述)、AI内のパラメータ更新行為は行われません。したがって本書における「学習」の意味を前提とすると、「検索拡張生成(RAG)等において、生成 AI への指示・入力に用いるためのデータベースの作成」行為は「開発・学習」段階の行為ではなく「生成・利用」段階の行為です。
 おそらく、「考え方」に記載されている「開発・学習段階」での「開発・学習」とは、本書における「学習」(AI内のパラメータ更新行為)と、そのようなパラメータ更新行為を伴わないICLの双方を総称した概念なのではないかと思います。
 また、「考え方」における「生成・利用段階」というのは、生成AIにおけるAI生成物の生成・利用行為を指しているのでしょう。
 すなわち「考え方」における「開発・学習」段階と「生成・利用」の意味をまとめると以下の図 123このように考えると、「考え方」18 頁「図3 生成AI への指示・入力に用いるためのデータベースの作成に伴う著作物の利用行為」が「開発・学習段階における著作物の利用行為」として整理されていることも理解できる。(https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/hoseido/r05_07/pdf/94011401_01.pdf)105、111、112、152 等も参照。となります。
 

図12

 もっとも、このような「考え方」における「開発・学習」段階と「生成・利用」段階の整理(図12)は必ずしも一般的なものではないため、本書では、これまで一般的に使われてきた用語との整合性という観点から、図 11における「開発・学習」段階と「生成・利用」段階の用語を用いることにします。
 なお、「学習」も「In-Context Learning(ICL)」もいずれも「情報解析」(法30条の4第2号)に該当する4これは、「情報解析」(法30 条の4第2号)が多種多様な情報処理を包含する広範な概念であること、また、ICL においては、AI 内のパラメータの物理的な更新行為は行われないが、見方を変えると、あたかもパラメータを変えて学習した場合と同様に、指示や今生成しているデータに合わせて、パラメータを一時的に更新し、モデルを急速に適応させているとみなすことができるとされていることを根拠としている。ので、「開発・学習」「生成・利用」という用語をどのような意味で用いるかによって、著作権侵害についての結論が大きく変わるわけではありません。

(3) 開発・学習段階と生成・利用段階の著作物利用行為と著作権侵害

 AI開発者・AI提供者・AI利用者が著作権侵害の責任を負う可能性がある場面は「開発・学習段階における著作物の利用行為」と「生成・利用段階における著作物の利用行為」の2つです。

ア 開発・学習段階における著作物利用行為

 AI開発者等が「開発・学習段階」において著作物の利用行為(たとえばWeb上の著作物の収集など)を行う場合です。
 典型的には以下のように、AI開発者が、第三者の著作物を利用してAIを開発し当該AIをAI利用者に提供し、AI利用者が当該AIを利用してAI生成物を生成するパターンです(図 13)。
 

図13

 この場合は、AI開発者が開発・学習段階における著作物利用行為を行っています。
 また、先ほど説明したとおり、AI利用者自身が小規模なデータで追加学習を行うこともあります(図 14)。
 

図14

 このケースでは、AI利用者も開発・学習段階における著作物利用行為を行っています。
 つまり、AI開発者・提供者・利用者いずれであっても開発・学習段階における著作物利用行為を行う可能性があるということになります。
 むしろ、AI開発者が行う大規模な(大量のデータを用いての)学習よりも、AI提供者や利用者が行う少量のデータを用いた追加学習・ファインチューニングの方が著作権侵害に該当する可能性が高い(詳細は後述します)ため、AI提供者・AI利用者は特に注意が必要です。

イ 生成・利用段階における著作物の利用行為

 もう1つは、生成・利用段階における著作物利用行為です。
 例えば、以下のようにAI利用者が既存著作物をAIに入力し、当該入力著作物と同一・類似のAI生成物を生成して利用(販売等)を行った場合などです(図 15)。
 この場合、既存著作物の利用行為(入力・生成・販売等)を物理的に行っているのはAI利用者のみですから、AI利用者の著作権侵害のみが問題となります。
 

図15

 もっとも、生成・利用段階における著作物の利用行為についてAI開発者が著作権侵害の責任を負う可能性が全くないかというと、そうではありません。
 AI開発者が、生成・利用段階では著作物の利用行為を物理的には行っていないケースでも、AI利用者が生成・利用段階で著作権侵害行為を行った場合に、AI開発者が、行為主体として、当該生成・利用段階における著作権侵害の責任を負うことがあるのです(いわゆる規範的行為主体論)5「考え方」36 頁
 たとえば、AI開発者が既存著作物を学習用データとしてAIを制作して提供・公開したところ、AI利用者が当該AIを利用して、学習に用いられた既存著作物と同一・類似のAI生成物を生成した場合を考えてみます(図 16)。
 

図16

 この場合、AI開発者は、開発・学習段階では著作物の利用行為を行ってはいますが、生成・利用段階では著作物の利用行為を物理的には行っていません。もっとも、AIを開発・提供したことに基づいて、AI開発者も行為主体として生成・利用段階での著作権侵害の責任を負うことが場合によってはありえるのです。

ウ まとめ

 以上を踏まえ、本書では「2 開発・学習段階における著作物利用行為と著作権侵害」と「3 生成・利用段階における著作物利用行為と著作権侵害」に分けて説明をしていきます。

脚注一覧

  • 1
    ここでいう「ローカル」には、AI利用者自身が管理するクラウド環境も含む。
  • 2
    たとえばテキスト生成AI への入力プロンプトとして「……について説明してください。その際には以下の資料を参考にしてください。#資料1#資料2」のように、指示文とともに、正確な出力生成に必要な文書等のデータを同時に入力する方法がICL である。
  • 3
    このように考えると、「考え方」18 頁「図3 生成AI への指示・入力に用いるためのデータベースの作成に伴う著作物の利用行為」が「開発・学習段階における著作物の利用行為」として整理されていることも理解できる。(https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/hoseido/r05_07/pdf/94011401_01.pdf)105、111、112、152 等も参照。
  • 4
    これは、「情報解析」(法30 条の4第2号)が多種多様な情報処理を包含する広範な概念であること、また、ICL においては、AI 内のパラメータの物理的な更新行為は行われないが、見方を変えると、あたかもパラメータを変えて学習した場合と同様に、指示や今生成しているデータに合わせて、パラメータを一時的に更新し、モデルを急速に適応させているとみなすことができるとされていることを根拠としている。
  • 5
    「考え方」36 頁
🔈 音声で内容を復習する

この記事の内容を、対話形式の音声で聞くことができます。
▶ 対話形式で聞く

※ 対話形式の音声はNotebookLMを利用して自動的に作成したものです。正確な内容は記事本文をご参照ください。