人工知能（ＡＩ）、ビッグデータ法務　コンテンツビジネス法務（知的財産権、著作権）　未分類

歌手・声優の「声」と生成AI（3）～設例の解説～

2024/10/28

柿沼太一

　本記事は、「歌手・声優の「声」と生成AI（2）」の続きの記事です。
　AI技術の発展により、歌手や声優の「実演」「声」を簡単に学習・生成できるようになり、社会的に大きな議論となっています。
　弊所でも、この問題についてエンタメ系の事業会社や、歌手・声優等の方々からご相談を受けるようになりました。
　この問題については、不正競争防止法の改正や新法の制定など立法論についても議論が盛んになっていますが、そもそも現行法上の解釈自体がまだ明確になっているとは言えません。
　そこで、本記事では歌手や声優の「実演」「声」と生成AIの問題について、「現行法上はどのような結論になりそうか」について、具体的事例をもとになるべく詳しく検討してみました（長いので3つの記事に分けています。）
　今後の議論のスタート地点になれば幸いです¹。

Contents

1 ■　設例
2 5　設例の検討

■　設例

（1）　ゲーム制作会社α社は、新作ゲームにおけるキャラの会話音声を生成するために、様々な市販ゲーム内の、様々な声優によるセリフ音声を大量に収集した。
　そして当該セリフ音声を用いて、「セリフ音声、セリフ内容（セリフ文字）、セリフが用いられている場面、キャラの性別、キャラの特徴」のみで構成された学習用データセットを作成した。当該学習用データセットには、ゲーム名、キャラ名、声優名データは含まれていない。
　その上で、当該学習用データセットを利用して機械学習技術を利用して音声生成AI（以下「汎用型音声生成AI」という）を作成した。
汎用型音声生成AIでは、キャラの特徴（性別等や性格等）、セリフ場面及び読ませたいセリフ内容（セリフ文字）を入力すると、当該キャラクターの特徴やセリフ場面に応じたセリフ音声を作成することができる。ただし、汎用型音声生成AIでは、セリフ音声生成に際して、実在の
声優やキャラクター名の指定はできず、さらに学習に利用した声優の音声やセリフ内容が、そのまま出力されないような技術的な仕組みが備えられているものとする。
　α社は、新作ゲームの制作に際して、汎用型音声生成AIを用いて、実在する声優の声には類似しないセリフ音声を新たに生成してゲーム内の音声として利用し、当該ゲームを公開・販売した。α社の行為は何らかの権利侵害に該当するか。

（2）　ゲーム会社α社が新作ゲームを公開したところ、汎用型音声生成AIに関する評判が高まり、是非当該AI及び当該AIを作成する際に用いた音声データセットを販売して欲しいとの多数の引き合いがあった。そこで、α社は「ゲームやアニメに利用可能。状況に応じた高品質なセリフ音声が簡単に作成できる！」という謳い文句で、汎用型音声生成AI及び音声データセットを販売した。販売の際には、声優名、キャラ名、作品名は一切表示していない。この場合、α社の行為は何らかの権利侵害に該当するか。

（3）　AI会社β社は、人気歌手の声を利用した新曲を作成してリリースしたいと考えた。そこで、様々な著名歌手の歌唱音声データを大量に収集して、一般に公開されている大規模な音声生成AIに追加学習を行って、特定の歌手の歌声を生成できる音声生成AI（以下「特化型音声生成AI」という）を作成した。この特化型音声生成AIは、以下のような機能①～⑤を備えている。
　①　特定の歌手名と、既存またはオリジナルの歌詞・メロディーを入力して当該歌手の歌唱音声を生成する。
　②　特定の歌手名と、既存の楽曲名を入力して当該歌手の歌唱音声を生成する。
　③　特定の歌手名のみ入力して、自動生成された歌詞・メロディーを歌わせた歌唱音声を生成する。
　④　特定の歌手の既存楽曲の実演データを入力して、同じ曲を当該歌手の声で少し違う雰囲気で歌った歌唱音声を生成する。
　⑤　特定の歌手の既存楽曲の実演データと、既存またはオリジナル歌詞・メロディーを入力して、当該歌手の歌唱音声を生成する。
　β社は、新曲を制作するに際して、特化型音声生成AIの機能①を用いて、有名歌手Xの名前とオリジナルの歌詞・メロディーを入力し、ある有名歌手Xの歌唱音声を生成して公開・販売した。当該Xの歌唱音声は、メロディー・歌詞内容としてはこれまでXが歌唱したことがないものであったが、声はXそのものであった。β社の行為は何らかの権利侵害に該当するか。

（4）　β社が、「有名歌手の声を簡単に再現可能。あなたの手元で、あらゆる声であらゆる歌を。」という謳い文句で特化型音声生成AI及び音声データセットを販売した場合、何らかの権利侵害に該当するか。

（5）　β社が販売した特化型音声生成AIを購入したAI利用者γが、同AIの機能①～⑤を利用して、有名歌手Ｙの様々な歌唱音声を生成して販売した。AI利用者γ及びβ社の責任をどう考えるべきか。

5　設例の検討

（1）　設例1

　設例1においては、ゲーム制作会社α社は、様々な市販ゲーム内の、様々な声優によるセリフ音声を大量に収集してAI学習に利用して汎用型音声生成AIを作成しています。もっとも、当該音声AIを利用して、特定の声優のセリフ音声データの作成はしていませんので、「開発・学習パターン1」の行為のうち汎用型AI生成のための学習しか行っていないことになります。
　

　そして、①αは汎用型AIの学習に際してゲーム名、キャラ名、声優名データをデータとして利用しておらず、②当該汎用型AIにおいては、セリフ音声生成に際して、実在の声優やキャラクター名の指定はできず、さらに学習に利用した声優の音声やセリフ内容が、そのまま出力されないような技術的な仕組みが備えられていいます。
　これを前提とすると、設例1におけるα社の行為は、学習用データセットに含まれている声データの著作権・著作隣接権・パブリシティ権いずれの侵害にも該当しません。

（2）　設例2

　α社が販売した学習用データセットには、「セリフ音声、セリフ内容（セリフ文字）、セリフが用いられている場面、キャラの性別、キャラの特徴」のみで構成されており、ゲーム名、キャラ名、声優名データは含まれていません。また、汎用型音声生成AIは、上記①②の特徴を備えています。

　したがって、このような汎用型生成AIの販売・公開や当該AI作成のために用いられた学習用データセットの販売・公開は声データの著作権・著作隣接権・パブリシティ権いずれの侵害にも該当しません。

（3）　設例3

　設例3においては、β社は①様々な著名歌手が歌唱している楽曲を大量に収集して、一般に公開されている大規模な音声生成AIに追加学習を行って、特定の歌手の歌声を生成できる特化型音声生成AIの作成行為と、②当該特化型音声生成AIを利用して、オリジナルのメロディー・歌詞についての、ある有名歌手Xの声で新曲を歌唱させ、当該Xの歌唱音声（当該Xの歌唱音声は、メロディー・歌詞内容としてはこれまでXが歌唱したことがないものであったが、声はXそのもの）を公開・販売していますので、それぞれについて検討をする必要があります。

ア　特化型音声生成AIの作成行為（追加学習行為）

（ア）　著作権

　βは特化型音声生成AIの作成行為（追加学習行為）のために、大量の歌唱音声を収集してAI学習のために用いています。当該収集・利用行為については著作権法30条の4が適用されるため原則として適法ですが、表現出力目的（享受目的）がある場合には同条は適用されません。
　そして設例3においては、βが作成した特化型音声生成AIは、機能②として「②　特定の歌手名と、特定の曲名を入力して、指定した当該歌手の当該曲の歌唱曲データを生成する」機能があります。このような機能は、AI学習の際に「曲名・歌手名・歌唱音声」を利用して学習した場合に実現することができます。
そして、この機能②を利用すると、AI利用者が特定の曲データ（メロディー及び歌詞）を入力しなくとも、特定の曲名を指定するだけで、特定の曲データ（メロディー及び歌詞）を生成することが出来ます。
　したがって、βにおける、機能②開発のための学習は、学習に際して、学習対象となった曲データのうちのメロディー及び歌詞部分（著作物部分）を出力する目的（表現出力目的）があるということになり、著作権法30条の4が適用されず、他の権利制限規定が適用されなければ著作権侵害に該当します。
一方、仮にβが機能②が実現できないように、学習の際に「曲名」をあえてデータとして用いない学習をしたのであれば、表現出力目的は存在せず原則に戻って著作権法30条の4が適用され著作権侵害には該当しません。

（イ）　著作隣接権

　機能②を利用すると、学習に用いられた有名歌手の実演に類似した実演を生成することができますが、このような特定の実演を再現する目的の学習をしたとしても、102条で準用される30条の4は適用され、設例3におけるβの追加学習行為は著作隣接権侵害には該当しないと考えます。

（ウ）　パブリシティ権

　開発・利用パターン1のところで説明したとおり、、特化型音声生成AI開発のための著名人の声データの利用行為であっても、当該著名人のパブリシティ権侵害には該当しません。
　したがって、設例3におけるβの追加学習行為はパブリシティ権侵害に該当しないと考えます。

イ　特化型音声生成AIを利用して有名歌手Xの「新曲」を生成・公開した行為

　設例3において、βは、歌手名Xと、オリジナルの歌詞・メロディーを入力して有名歌手Xの「新曲」を作成していますが、当該「新曲」は「メロディー・歌詞内容としてはこれまでXが歌唱したことがないものであったが、声はXそのもの」です。
　したがって、設例3の、βによる生成・利用段階の行為のみをピックアップし、さらに「声データ」に含まれている法的権利を示すと下記の図のとおりとなります。

　この場合、βが生成・販売しているのはXの「声」だけですから、著作権・著作隣接権侵害には該当しません。
　もっとも、当然のことながら、βの行為はXがその「声」について有しているパブリシティ権侵害に該当します。

（4）　設例4

　設例4におけるβの行為は、特化型音声生成AI作成のための学習用データセット及びモデルの販売行為です。

ア　著作権

　設例4においては、βが作成した特化型音声生成AIは、機能②として「特定の歌手名と、特定の曲名を入力して、指定した当該歌手の当該曲の歌唱曲データを生成する」機能があり、同機能を利用すると、AI利用者が特定の曲データ（メロディー及び歌詞）を入力しなくとも、特定の曲名を指定するだけで、特定の曲データ（メロディー及び歌詞）を生成することが出来ます。
したがって、そのような機能を持つAI作成のための学習用データセット及びモデルの販売行為については30条の4は適用されず、他の権利制限規定が適用されなければβの行為は著作権侵害に該当します。
　一方、仮にβが機能②が実現できないように、学習の際に「曲名」をあえてデータとして用いない学習をしたのであれば、表現出力目的は存在せず、データセットやAIの販売行為には著作権法30条の4が適用され著作権侵害には該当しません。

イ　著作隣接権

　機能②を利用すると、学習に用いられた有名歌手の実演に類似した実演を生成することができますが、このような特定の実演を再現する目的の学習をしたとしても、102条で準用される30条の4が適用されます。したがって、設例4におけるβの特化型音声生成AI作成のための学習用データセット及びモデルの販売行為は著作隣接権侵害には該当しないと考えます。

ウ　パブリシティ権

　既に説明をしたとおり、特化型音声生成AI作成のための学習用データセット及びモデルの販売行為は、学習に用いられた著名人の声に関するパブリシティ権の侵害に該当すると考えます。

（5）　設例5

ア　AI利用者γの責任

　AI利用者γが特化型音声生成AIの機能①～⑤を用いて行った各行為は、以下のいずれか（生成・利用パターン4か同5）に該当します。

　例えば、機能①を利用して「特定歌手名と、既存の歌詞・メロディーを入力して当該歌手の歌唱音声を生成する」γの行為は、「既存の歌詞・メロディー」という著作物を入力し、特定の歌手の既存の歌詞・メロディーの歌唱音声（著作物＋声）を生成していますので、パターン5に該当します。この場合、生成された歌唱音声を販売する行為は、既存の歌詞・メロディーの著作権侵害及び当該歌手のパブリシティ権侵害に該当します。
　また、機能②を利用して「特定の歌手名と、既存の楽曲名を入力して当該歌手の歌唱音声を生成する」γの行為は、非著作物（歌手名及び楽曲名）を入力して、特定の歌手の既存の歌詞・メロディーの歌唱音声（著作物＋声）を生成していますので、パターン4に該当します。この場合も、生成された歌唱音声を販売する行為は、既存の歌詞・メロディーの著作権侵害及び当該歌手のパブリシティ権侵害に該当します。

イ　追加学習者βの責任

（ア）　著作権侵害

　考え方37頁では「AI利用者のみならず、生成 AI の開発や、生成 AI を用いたサービス提供を行う事業者が、著作権侵害の行為主体として責任を負う場合があると考えられる。」とし、下記のように記載しています。

① ある特定の生成 AI を用いた場合、侵害物が高頻度で生成される場合は、事業者が侵害主体と評価される可能性が高まるものと考えられる。
② 事業者が、生成 AI の開発・提供に当たり、当該生成 AI が既存の著作物の類似物を生成する蓋然性の高さを認識しているにも関わらず、当該類似物の生成を抑止する措置を取っていない場合、事業者が侵害主体と評価される可能性が高まるものと考えられる。

　そしてβが作成した特化型音声生成AIは、機能②として「②　特定の歌手名と、特定の曲名を入力して、指定した当該歌手の当該曲の歌唱曲データを生成する」機能があります。
　この機能②を利用すると、AI利用者が特定の曲データ（メロディー及び歌詞）を入力しなくとも、特定の曲名を指定するだけで、特定の曲データ（メロディー及び歌詞）を生成することが出来ます。
したがって、このような機能を備えている特化型音声生成AIは上記考え方の「ある特定の生成 AI を用いた場合、侵害物が高頻度で生成される場合」に該当することもありえ、その場合は、γが行った著作権侵害行為について、βが著作権侵害の侵害主体と評価される可能性が高まるものと考えられます。

（イ）　パブリシティ権侵害

　①　AI利用者γによるパブリシティ権侵害行為の侵害主体としての責任
　著作権侵害における規範的行為主体論と同様、γによる有名歌手Ｙのパブリシティ権侵害行為について、Γのみならずβも侵害主体としての責任を負うかが問題となります。
著作権侵害においては「侵害物が高頻度で生成されること」がAI開発者の行為主体性を肯定する重要な要素でした。この点を重視すると、βは特化型音声生成AIを開発・提供していることから、侵害主体としての責任を負うようにも思えます。
　しかし、確かに特定著名人の類似の「声」の「生成」には特化型音声生成AIが寄与していますが、「生成」自体はパブリシティ権侵害に該当しないこと（この点は著作権侵害との相違点です）、Γによるパブリシティ兼侵害行為（特定著名人の声データのの「侵害三類型」での「利用」）にβは一切関与していないことからすると、結論としては、βがそのような侵害主体責任を負うことはないと考えます。
②　AI利用者γによるパブリシティ権侵害行為の幇助責任
　また、設例5においては、βが販売した特化型音声生成AIを利用して生成した有名歌手Ｙの歌唱音声を用いてAI利用者γがパブリシティ権侵害行為を行っています。
　この場合、特化型音声生成AIを販売したαが、当該γのパブリシティ権侵害行為に対する幇助責任も負うかも問題となります。
　この点については、著作権侵害行為に用いられるツール提供者の損害賠償責任について認めた2つの最高裁判決（最二小判平成13．3．2民集55巻2号185頁「ビデオメイツ事件」及び最二小判平成13．2．13民集55巻1号87頁「ときめきメモリアル事件」）²を前提とすると、本件においては、βが提供している特化型音声生成AIは特定著名人の声を生成することが可能でパブリシティ権侵害に用いられる危険性がかなり高いこと、Βは当該特化型音声生成AIの提供により利益を受けていること、有名歌手の声を簡単に再現可能。あなたの手元で、あらゆる声であらゆる歌を。」という謳い文句で販売しており、当該モデルを購入した者がパブリシティ権侵害行為を行うことは容易に予見できることからすると、本件においてβは、γのパブリシティ権侵害行為に対する幇助責任を負うと考えます。

【脚注】

1
本記事で検討する設例においては、いずれも対象となるゲームデータや楽曲データの利用について当事者間に契約は存在しないものとします。
2
「ビデオメイツ事件」は、カラオケの経営者が著作権者の許諾を得ずにカラオケを提供した場合（著作権侵害行為に該当）において、当該経営者にカラオケ装置のリースしていたリース業者の幇助責任（損害賠償責任）を認めた事例、「ときめきメモリアル事件」は、専らゲームソフトの改変のみを目的とするメモリーカードを輸入、販売し、他人の使用を意図して流通に置いた者について、他人（ユーザー）の使用により、ゲームソフトの同一性保持権の侵害を惹起した者として損害賠償義務を認めた事例です。

知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】

ブログ/ BLOG

歌手・声優の「声」と生成AI（3）～設例の解説～

■　設例

5　設例の検討

（1）　設例1

（2）　設例2