人工知能(AI)、ビッグデータ法務 著作権
AIと著作権【第18回】で、結局何に気をつければよいのか~AI開発者・AI提供者・AI利用者それぞれの注意事項~
2025年7月にSTORIA法律事務所の柿沼・杉浦の共著で日本加除出版から書籍「AIと法 実務大全」を出版します。
本書は650頁超というボリュームでありながらも、AI開発や利活用に問題となる点を「網羅的」に解説するものではありません。あくまで、現場の方がAI開発や利活用を行う際に、法律的によく問題となる論点とその解決手法に照準を絞っています。その分個々の論点については、最先端の議論を下敷きにしつつ実務的に相当深掘りした記述となっています。
書籍の出版に先立ち、その一部である「第2章 生成AI開発・提供・利用と著作権」について日本加除出版からご了解を得て、ブログで連載記事として先行公開することとしました。
「一部」といっても記事合計13万字を越えるボリューム(ほぼ新書1冊分!)であり、ブログ公開を快諾いただいた日本加除出版には感謝しかありません。
この連載記事を読んで興味が湧いた方は是非書籍をお買い求めください!
連載「AIと著作権」全18回の目次を表示
- 第1回 プレイヤー・フェーズ・提供形態による法的整理
- 第2回 AI学習段階での著作物利用はどこまで許されるか?──著作権法第30条の4の射程
- 第3回 学習用データとして“何を使ってはいけないか”を見極める~学習対象の観点からの検討~
- 第4回 海賊版や学習禁止表示がされている著作物をAI学習に利用することができるか
- 第5回 開発・学習段階での著作権侵害行為が発生した場合、侵害者はどのような責任を負うか
- 第6回 生成・利用段階では何が問題になるのか?
- 第7回 類似AI生成物の「生成」における依拠性をどのように考えるか~複雑な論点を解きほぐす~
- 第8回 類似AI生成物の「生成」における行為主体性~ロクラクⅡ事件判決をベースに徹底的に考える~
- 第9回 生成された類似AI生成物を利用すると著作権侵害?
- 第10回 類似AI生成物の「送信」は誰の責任?──クラウド提供型AIにおける著作権侵害リスクを検証する
- 第11回 生成・利用段階で著作権侵害行為が認められた場合、権利者は何を請求できるのか
- 第12回 RAG・ロングコンテクストLLMと著作権侵害(前編)
- 第13回 RAG・ロングコンテクストLLMと著作権侵害(後編)
- 第14回 RAGシステムのための既存著作物の蓄積・入力などは著作権侵害になるのか
- 第15回 RAGとAI利用者の責任~入力・送信・出力のそれぞれで何が問われるか?~
- 第16回 AI生成物に著作権はあるのか?~著作物性と“創作的寄与”の最新実務論~
- 第17回 その行為に日本著作権法は適用されるか~準拠法の問題~
- 第18回 で、結局何に気をつければよいのか~AI開発者・AI提供者・AI利用者それぞれの注意事項~
🔊 音声で内容を復習する
この記事の内容を、対話形式の音声で聞くことができます。
▶ 対話形式で聞く
※ 対話形式の音声はNotebookLMを利用して自動的に作成したものです。正確な内容は記事本文をご参照ください。
Contents
7 まとめ:AI開発者・AI提供者・AI利用者それぞれの注意事項
(1) AI開発者
ア 開発・学習段階
開発・学習段階においては「学習目的による制限」と「学習対象による制限」があるとお伝えしましたが、AI開発者が大規模にデータを収集して大規模なモデルの事前学習に用いる場合、表現出力目的があることは通常は想定できないため、注意しなければならないのは「学習対象による制限」のうちの「情報解析用DB著作物」の利用のみです。
すなわち報道機関が、記事をWebで公開すると同時に情報解析用DB著作物を販売・提供していた場合において、当該Web上の記事を収集・蓄積して学習に用いた場合には、30条の4柱書但書に該当する可能性があります。そのため、少なくともrobots.txtでクローリングをブロックしているコンテンツについては、当該robots.txt上の記述を尊重してクローリングの対象から除外するという対応をすることを検討してもよいかもしれません。
また、AI開発者の場合、対象著作物の収集や学習に日本国外のリージョンのサーバを利用することも多いと思われます。その場合には、自らの行為に日本著作権法が適用されるかを必ず検討するようにしてください。
イ 生成・利用段階
生成・利用段階のAI利用者による著作権侵害行為によってAI開発者が責任(規範的行為主体としての侵害責任・幇助者としての損害賠償責任)を負うのは「ある特定の生成 AI を用いた場合、侵害物が高頻度で生成される場合」「事業者が、生成 AI の開発・提供に当たり、当該生成 AI が既存の著作物の類似物を生成する蓋然性の高さを認識しているにも関わらず、当該類似物の生成を抑止する措置を取っていない場合」です(考え方37頁)。大規模なAIモデルをAI利用者がそのまま利用した場合に、そのような事態が生じる可能性は極めて低いことから(生じたとするとAI利用者自身が積極的な行為をした場合だけでしょう)、生成・利用段階のAI利用者による著作権侵害行為によってAI開発者が責任を負う可能性は非常に低いと考えます。もっとも「当該生成 AI が既存の著作物の類似物を生成することを防止する措置」(考え方37頁)をとることは無用なトラブルを避けるためにも行った方が良いと考えます。
(2) AI提供者
ア 開発・学習段階
開発・学習段階でAI提供者が行う学習行為は、小規模な追加学習・ファインチューニングであることが通常であるため、「表現出力目的」の学習(具体的には学習用データと同一・類似の著作物を出力させるような過学習)を行わないように注意する必要があります。
仮に、ある著作物の学習の関係で、「表現出力目的」が認定されると当該学習のための当該著作物の収集・蓄積行為がすべて著作権侵害に該当します。後述のようにAI提供者が「表現出力目的」の学習を行い、その結果生成・利用段階においてAI利用者が著作権侵害を行うとAI提供者も当該侵害についての規範的な主体としての責任を負う可能性が高いのですが、その場合はあくまで、AI利用者による「個々の生成・利用行為」に関してAI提供者が著作権侵害の責任を負うに過ぎません。その意味で、開発・学習段階の著作権侵害の責任は、生成・利用段階での責任と比較して規模が大きくなることから、より注意が必要です。
また、「作風」と「表現」の境界は曖昧であることから、「作風模倣目的」での学習を行う意図であったとしても、結果として「表現出力目的」での学習であるとの認定がなされるリスクはかなりあると思われますので、「作風模倣目的」での学習を行う場合にもかなり注意が必要です。
さらに、「表現出力目的」の学習を行ったAIモデルを公開・販売した場合、当該公開・販売行為自体が著作権侵害に該当する可能性もあります。
イ 生成・利用段階
生成・利用段階でAI提供者が著作権侵害の責任を負う可能性があるのは、①AI提供者がRAG等において既存著作物の蓄積行為を行ってAI利用者に提供することによる直接侵害責任②AI利用者が著作権侵害行為を行った場合における責任(規範的行為主体としての責任及び幇助者としての責任)の2つです。
①については、RAGにおけるタイプ2及びタイプ8の場合に問題となります。それらのタイプにおいては、AI提供者が既存著作物の蓄積行為を行ってAI利用者に提供していますが、表現出力目的があることから30条の4が適用されません。したがって、他の権利制限規定(47条の5等)が適用されなければ当該蓄積行為が著作権侵害に該当することになりますが、47条の5については適用要件が非常に厳しいため、同条を根拠に適法化される可能性はかなり低いと思われます。したがって、タイプ2及び8に該当しないような設計が必要です。
②については、生成・利用段階のAI利用者による著作権侵害行為によってAI提供者が責任(行為主体としての責任・幇助者としての責任)を負うのは「ある特定の生成 AI を用いた場合、侵害物が高頻度で生成される場合」「事業者が、生成 AI の開発・提供に当たり、当該生成 AI が既存の著作物の類似物を生成する蓋然性の高さを認識しているにも関わらず、当該類似物の生成を抑止する措置を取っていない場合」です(考え方37頁)。
AI提供者が小規模な追加学習・ファインチューニングを行う場合において、当該学習が表現出力目的や作風模倣目的で行われる場合は「ある特定の生成 AI を用いた場合、侵害物が高頻度で生成される場合」に該当する可能性が高いでしょう。
したがって、小規模な追加学習・ファインチューニングを行う場合、表現出力目的や作風模倣目的での学習をしないこと、また可能であれば「当該生成 AI が既存の著作物の類似物を生成することを防止する措置」(考え方37頁)をとることが必要と思われます。
(3) AI利用者
ア 開発・学習段階
開発・学習段階でAI利用者が行う学習行為は、小規模な追加学習・ファインチューニングであることが通常であるため、「表現出力目的」の学習(具体的には学習用データと同一・類似の著作物を出力させるような過学習)を行わないように注意する必要があります。
また、「作風」と「表現」の境界は曖昧であることから、「作風模倣目的」での学習を行う意図であったとしても、結果として「表現出力目的」での学習であるとの認定がなされるリスクはかなりあると思われますので、「作風模倣目的」での学習を行う場合にもかなり注意が必要です。
イ 生成・利用段階
生成・利用段階でAI利用者が著作権侵害の責任を負う可能性があるのは、①AI利用者がRAG等において既存著作物の蓄積行為を行うことによる侵害責任、②既存著作物と同一・類似のAI生成物を生成・利用することによる侵害責任です。
①については、RAGにおけるタイプ4,6,8の場合に問題となります。それらのタイプにおいては、AI利用者が既存著作物の蓄積行為を行ってRAGに利用していますが、表現出力目的があることから30条の4が適用されません。したがって、他の権利制限規定(47条の5等)が適用されなければ当該蓄積行為が著作権侵害に該当することになりますが、47条の5については適用要件が非常に厳しいため、同条を根拠に適法化される可能性はかなり低いと思われます。したがって、タイプ4,6,8のようなRAGを構築・利用するのであれば、自らが著作権を保有している、あるいは適法にライセンスを受けている著作物(または非著作物)のみを利用対象とすべきでしょう。
②については、AI利用者にとって最も気になる部分かと思います。
AI利用者が生成AIを利用してAI生成物を生成して利用するプロセスは、「生成AIの選択」→「プロンプト等の入力」→「AI生成物の生成」→「生成したAI生成物の利用」に分けることが出来ます(図 1)。
したがって、著作権侵害を引き起こさないためには、AI利用者は当該各プロセスにおいて以下のような点に留意する必要があります(図98)。

図98
(ア) 生成AIの選択
① 学習に利用されている著作物はどのようなものかの確認(利用許諾を得ている著作物、保護期間が満了している著作物が利用されているか等)
② 著作権侵害を引き起こさないための技術的工夫(フィルタリングなど)があるかの確認
③ 特化型の学習(特定の著作権者や特定のキャラクターを生成する目的(表現出力目的・作風模倣目的の学習)をしていないかの確認
(イ) プロンプト等の入力
プロンプトに既存著作物(画像等)、作家名、作品の名称を入力しない。
(ウ) AI生成物の生成
「(ア) 生成AIの選択」「(イ) プロンプト等の入力」の留意事項を遵守していれば、「生成」そのものが著作権侵害になるリスクは低くなりますし、仮に既存著作物と同一・類似のAI生成物が生成されたとしても、それを「利用」しなければ実際に問題となる可能性はかなり低いと思われます。
(エ) 生成したAI生成物の利用
生成したAI生成物を利用(販売や商品内に利用する)場合には、ウェブ検索や剽窃チェックツールなどを用いて他人の既存著作物と類似していないかを確認する。
この記事の内容を、対話形式の音声で聞くことができます。
▶ 対話形式で聞く
※ 対話形式の音声はNotebookLMを利用して自動的に作成したものです。正確な内容は記事本文をご参照ください。