人工知能（ＡＩ）、ビッグデータ法務　コンテンツビジネス法務（知的財産権、著作権）　未分類

歌手・声優の「声」と生成AI（2）～生成・利用段階での利用～

2024/10/28

柿沼太一

　AI技術の発展により、歌手や声優の「実演」「声」を簡単に学習・生成できるようになり、社会的に大きな議論となっています。
　弊所でも、この問題についてエンタメ系の事業会社や、歌手・声優等の方々からご相談を受けるようになりました。
　この問題については、不正競争防止法の改正や新法の制定など立法論についても議論が盛んになっていますが、そもそも現行法上の解釈自体がまだ明確になっているとは言えません。
　そこで、本記事では歌手や声優の「実演」「声」と生成AIの問題について、「現行法上はどのような結論になりそうか」について、具体的事例をもとになるべく詳しく検討してみました（長いので3つの記事に分けています。）
　今後の議論のスタート地点になれば幸いです¹。

Contents

1 4　生成・利用段階における「声」の利用
2 ■　まとめ

4　生成・利用段階における「声」の利用

（1）　生成・利用段階において問題となるパターン

　生成・利用段階での声データの利用パターンは様々なものがありますが、代表的なものは以下の5つです。

①　生成・利用パターン1
　人の声データをAIに入力して、当該声データとは異なるデータ（AI生成物）を生成するパターンです。たとえば、特定の歌手の歌声データを入力すると、どの歌手の声か判別する音声識別AIや、特定の歌手の声とAI利用者の声を同時に入力し、AI利用者の声で当該歌手「風」の歌声データを生成するようなパターンです。
②　生成・利用パターン2
　人の声データをAIに入力して、当該声データと同一・類似の声データ（AI生成物）を生成するパターンです。たとえば、特定の歌手の歌声データと歌詞・メロディーデータを入力し、当該歌手の声での当該歌詞・メロディーの歌声データを生成するパターンです。ただしパターン2においては、当該特定の歌手の歌声データは学習に用いられていないものとします。
③　生成・利用パターン3
　人の声データではないデータや指示をAIに入力して、実在する人物の声データと同一・類似の声データ（AI生成物）を生成するパターンです。たとえば、特定の声優名を入力して、当該声優の声データを生成するパターンです。ただしパターン3においては、当該特定の声優の声データが学習に用いられていないものとします。
④　生成・利用パターン4
　パターン3と同様、人の声データではないデータや指示をAIに入力して、実在する人物の声データと同一・類似の声データ（AI生成物）を生成するパターンです。ただしパターン4においては、当該特定の声優の声データが学習に用いられてるものとします。また、パターン4では、当該学習が、AI開発者によって行われている場合や、AIサービス提供者によって行われている場合（追加学習）、AI利用者によって行われている場合（追加学習）があります。
⑤　生成・利用パターン5
　パターン2と同様、人の声データをAIに入力して、当該声データと同一・類似の声データ（AI生成物）を生成するパターンです。ただしパターン5においては、当該特定の人物の声データが学習（追加学習）に用いられてるものとします。パターン5でも、当該学習が、AI開発者によって行われている場合や、AIサービス提供者によって行われている場合（追加学習）、AI利用者によって行われている場合（追加学習）があります。

（2）　生成・利用段階における声データの利用行為の分類

　生成・利用段階での声データの法的な権利侵害が問題となる場合、サービス全体が侵害になるか、というような大雑把な検討ではなく、声データの利用行為ごとに権利侵害が成立するか否かを検討する必要があります。
　上記パターン1～5においては、生成・利用段階における著作物の利用行為として、①声データの「入力」、②声データの「生成」、③声データの「利用」（公表や販売等）の3つの場面で声データの利用行為が行われていますので、それぞれについて検討が必要です。
　たとえば、生成・利用パターン2では「入力」「生成」「利用」全てが行われています。

（3）　生成・利用パターン1

　人の声データをAIに入力して、当該声データとは異なるデータ（AI生成物）を生成するパターンです。たとえば、特定の歌手の歌声データを入力するとどの歌手の声か判別する音声識別AIや、特定の歌手の声とAI利用者の声を同時に入力し、AI利用者の声で当該歌手「風」の歌声データを生成するようなパターンです。

ア　著作権

　既存著作物（歌詞・メロディー・セリフ等）を音声生成AIに入力する行為の適法性が問題となります。
　AIに入力された既存著作物の解析及びAI生成物の生成行為は、「情報解析」（著作権法30条の4第2号）に該当するため、それらの情報解析に必要と認められる限度において、いずれの方法によるかを問わず、法30条の4により著作物を利用することができます。
　したがって、既存著作物の解析及びAI生成物の生成のための既存著作物の蓄積・入力行為は法３０条の4が適用され、原則として適法となります（考え方21～22頁及び37頁）。

イ　著作隣接権

　著作権法第102条により同30条の4が準用されるため、実演データを生成AIに入力する行為は著作隣接権侵害に該当しません。

ウ　パブリシティ権

　この場合、著名人の声データは生成AIに入力されて解析されているだけなので、「侵害三類型」に該当せず、パブリシティ権侵害には該当しません。

（4）　生成・利用パターン2

　人の声データをAIに入力して、当該声データと同一・類似の声データ（AI生成物）を生成するパターンです。たとえば、特定の歌手の歌声データと歌詞・メロディーデータを入力し、当該歌手の声での当該歌詞・メロディーの歌声データを生成するパターンです。ただしパターン2においては、当該特定の歌手の歌声データは学習に用いられていないものとします。

ア　著作権

（ア）　入力

　パターン1で説明したように、既存著作物の解析及びAI生成物の生成のための既存著作物の蓄積・入力行為は法30条の4が適用され、原則として適法となりますが、パターン2の場合、入力行為に　「表現出力目的」（入力された著作物の表現上の本質的特徴を再現する目的）があることが通常であるため、30条の4が適用されません。
　したがって、他の権利制限規定の適用がない限り、既存著作の入力行為は著作権侵害に該当します。

（イ）　生成

　パターン2の場合、入力された既存著作物と類似・同一の出力データが生成されていますので「複製」に該当し、権利制限規定の適用がなければ著作権侵害に該当します。なお、この場合に、著作権侵害の要件である「依拠性」は問題なく認められます（「考え方」33頁）。

（ウ）　利用

　生成された「既存著作物の類似データ」を利用（販売・公開）する行為は、当該既存著作物の「複製」や「公衆送信」に該当しますので、権利制限規定の適用がなければ著作権侵害に該当します。

イ　著作隣接権

（ア）　入力

　著作権法第102条により同30条の4が準用されるため、原則として実演データを生成AIに入力する行為は著作隣接権侵害に該当しません。問題は、著作権と同様「表現出力目的」（享受目的）があるとして30条の4が適用されないかですが、前述のように、そもそも実演の法定利用行為における「享受」「非享受」の意義が明確ではないため、この点についてもはっきりしません。

（イ）　生成

　AI（学習済みモデル）によって新たにAI実演を作成することが、AIに入力された実演（入力実演）の実演家の著作隣接権を侵害するか（当該AIによってAI実演を作成することが学習用データである当該実演家の実演の「録音（法2条1項13号）」といえるか）の問題です。
　非常に興味深い論点であり、この点について論じている先行文献はいくつかありますが² 、統一見解はありません。
①　場合分け
　この論点については、以下のように問題となる場面を分けて検討する必要があると思われます。実演家AのAI実演が無断で作成されたケースを考えてみます。

　まず「実演の対象（メロディーやセリフ等）」として、「実演家A（歌手や声優等）が過去に実際に実演したことがある著作物等」か、そうでないものかを分けます。
　次に「実演の作成方法」として、「実演家Aの過去の特定の実演をコピーする行為」「実演家Aの音声の特徴量と同一の特徴量の音声を利用した実演を新たに作成する行為」「実演家Aの声と似ているが特徴量は異なる音声を利用した実演を新たに作成する行為」に分けてみました。
　「実演家Aの過去の特定の実演をコピーする行為」というのは、単に複製機器を用いて過去の特定の実演（例：2021年3月5日に東京ドームで実演家Aにより行われた曲αの実演）をコピーする行為です。
　「実演家Aの音声の特徴量と同一の特徴量の音声を利用した実演を新たに作成する行為」とは、実演家Aの過去の実演から、実演家Aの音声の特徴量を抽出し、当該特徴量を用いて新たな実演を生成する行為です。この場合、実演家Aの過去の特定の実演を切り貼りしたりコピーしているわけではありません。このような手法を用いれば、「実演家A（歌手や声優等）が過去に実際に実演したことがない著作物等」について、実演家Aの声を用いた実演（⑤）が作成できます。近時世の中で問題となっているAIカバーはこのタイプです。
　最後に「実演家Aの声と似ているが特徴量は異なる音声を利用した実演を新たに作成する行為」です。これは典型的にはもの真似芸人によるもの真似行為（④⑦）です。もの真似芸人の、実演家Aのもの真似は人間が聞けば確かに実演家Aの声に似てはいますが、特徴量を比較すると明確に区別することが出来ます。
　もちろん、AIを用いてこのように「似てはいるが特徴量が異なる声」を作成することも容易にできるでしょう。
　したがって、この「実演家Aの音声の特徴量と同一の特徴量の音声を利用した実演を新たに作成する行為」については「異なる実演家が存在せず、機械的に生成されたもの」（③⑥）と「実演家Aとは異なる（人間の）実演家によるもの」（④⑦）に分けて考える必要があります。
②　検討
　まず、実演家Aの過去の特定の実演をコピーする行為（①）が実演家の録音権等を侵害することは明らかです。
　次に、「実演家Aの声と似ているが特徴量は異なる音声を利用した実演を新たに作成する行為」のうち、実演家Aとは異なる人間の実演（④）が実演家Aの録音権等を侵害することはありません。当該異なる実演家によって新たに作成された実演は、実演家Aの過去の特定の「実演」とは異なる実演だからです³ 。
　また、「実演家A（歌手や声優等）が過去に実際に実演したことがない著作物等」（表⑤⑥⑦）に関しては、実演家Aの著作隣接権を侵害することはあり得ません⁴。侵害対象となる「実演」が存在しないからです。
　まとめると以下のとおりです。

　したがって、現行法上の解釈として問題となるのは②③のタイプが実演家の権利を侵害するか否か、言い方を変えると①と②③の境界線はどこにあるか、です。
　この点については、理論的には一部肯定する見解（つまり、②も①と同じく実演家の権利を侵害すると考える見解）もありますが、安藤和宏「音声の法的保護に関する一考察」髙部眞規子ほか編「切り拓く——知財法の未来（三村量一先生古希記念論集）」（2024年、日本評論社）」703頁以下では、「統計モデル型音声合成方式」（AIを利用する音声合成は通常この方式と思われます）の場合は、以下のように②③いずれも実演家の権利を侵害しないとしています。私も同意見です。

ただし、音声合成ソフトが生成する音声の元となった実演を、果たして特定することができるかという問題がある。AI美空ひばりのように、同一人物の歌唱音声を集積し、音声コーパスを作成する場合、元となった実演を特定することは不可能であろう。たとえば、 AI美空ひばりが発声する「あ」の音が大ヒット曲「悲しい酒」の中のせりふ「あの人の面影・・・・・・」を使っているのか、「川の流れのように」のサビ部分「ああ川の流れのように」を使っているかを判別することは困難であろう。
そもそも音声合成ソフトが実際に録音された内容をつなぎ合わせて使用する方法である「録音編集方式」ではなく、音声化したいテキストの音素ごとの言語特徴量を求めてから、統計モデル辞書と言語特徴量を使用して、テキストに対応する音響特徴量を持つ音声波形を生成する「統計モデル型音声合成方式」を採用している場合、合成された音声は元の音と物理的に同一ではないため、著作隣接権の侵害にはならない。

　以上を前提とすると、パターン2における、AIに入力された実演（入力実演）と類似するAI実演を生成する行為は、当該入力実演の実演家の著作隣接権を侵害しないと考えます。

（ウ）　利用

　パターン2で生成されたAI実演を利用（販売・公開）する行為は、そもそも当該AI実演は入力実演の「録音物」ではありませんので、著作隣接権侵害に該当しません。

ウ　パブリシティ権

　AI利用者が著名人の声データを生成AIに入力し、当該声と同一・類似の声を生成して「利用（販売等商用利用）」するパターンです。
　この場合、著名人の声データの「入力」は「侵害三類型」に該当せず、パブリシティ権侵害には該当しません。
　また、生成AIを利用して生成されたAI実演（AI生成物）に、入力された著名人の声と同一・類似の声が含まれていた場合であっても、当該「声」を「生成」するだけ（つまり、ある特定の著名人の声を生成するだけ）では「侵害三類型」には該当しませんので、パブリシティ権侵害には該当しません。
　一方、AI利用者が生成AIを利用して生成された特定の著名人の「声」を「利用（販売等商用利用）」する行為は当然「侵害三類型」に該当しますので、パブリシティ権侵害にあたります。

（5）　生成・利用パターン3

　人の声データではないデータや指示をAIに入力して、実在する人物の声データと同一・類似の声データ（AI生成物）を生成するパターンです。たとえば、特定の声優名を入力して、当該声優のセリフ音声データを生成するパターンです。ただしパターン3においては、当該特定の声優の声データが学習に用いられていないものとします。

ア　著作権

　パターン3の場合、著作権侵害の「依拠性」があるかが問題となりますが、「考え方」３３頁～３４頁の記載を踏まえると、AI利用者が生成AIを利用して既存著作物と同一・類似のAI生成物を生成した場合に、既存著作物との依拠性が認められるかは以下のフローチャートに従って判断すべきと考えます。

　したがって、パターン3においても、AI利用者が既存著作物を認識しつつ、当該既存著作物と同一・類似のAI生成物を生成する意図の下にAIを操作している場合（AI利用者による依拠）がある場合には依拠性が認められ、AI生成物の生成・利用ともに著作権侵害になります。
　一方、AI利用者において、そのような認識や意図がない場合、パターン3においては、対象著作物が学習用データに含まれていないことから、AI利用者による依拠もAIによる依拠もないことになり、「独自創作」としてAI生成物の生成・利用ともに著作権侵害に該当しません。

イ　著作隣接権

　既に述べたように、AIを利用して既存の実演と同一類似の実演を生成する行為は、当該既存実演の「録音」と言えないことから、パターン3におけるAI実演の生成・利用は著作隣接権の侵害に該当しません。

ウ　パブリシティ権

　著作権と同様、①　AI利用者が特定の著名人の声と同一・類似の声を生成する意図の下試行錯誤して当該類似声を生成して利用する場合と、②AI利用者が意図せず偶然同一・類似の声が生成され、かつ当該著名人のことをAI利用者が知らない場合⁵ の2つに分かれます。
　まず、①②いずれの場合でも、当該AI生成物を「生成」するだけ（つまり、ある特定の著名人の声を生成するだけ）では「侵害三類型」には該当しませんので、パブリシティ権侵害には該当しません。
　一方、生成された声を「利用（販売等商用利用）」する行為については、①と②を分けて検討する必要があります。
　まず、①の場合は、AI利用者が単にAIをツールとして利用して類似の声データを生成して販売していますので、「侵害三類型」に該当し、パブリシティ権侵害に該当することは明らかです。
一方、②の場合は、AI利用者は当該著名人のことを知らずに「偶然」類似の声を生成して販売しています。当該行為がパブリシティ権侵害に該当するのでしょうか。
　このような場合にAI利用者がパブリシティ権侵害の責任を負うかについては、①そもそもパブリシティ権侵害の要件として「依拠性」が必要なのか、②AIを利用したパブリシティ権侵害におけるAI利用者の「過失」をどう考えるのか、の2つが問題となります。
　この問題については、別の機会⁶に詳細は述べているので、ここでは結論だけ記載すると、パブリシティ侵害の要件としては「依拠性」は不要と考えます。
　また、AIで生成した人物の肖像や声を侵害三類型で利用する場合には、当該生成・利用者には「データセット内のデータと、自動生成された人物肖像や声の一致度を比較照合する注意義務（照合義務）」が課され、当該義務を怠れば過失が肯定されると考えます。

（6）　生成・利用パターン4

　パターン3と同様、人の声データではないデータや指示をAIに入力して、実在する人物の声データと同一・類似の声データ（AI生成物）を生成するパターンです。ただしパターン4においては、当該特定の著名人の声データが学習に用いられてるものとします。
　そして、このパターン4には、以下のようにAIサービス提供者が特定の著名人の声データを追加学習する場合や、AI利用者自身が特定の著名人の声データを追加学習する場合があります。

ア　著作権⁷

　パターン4においても、パターン3と同様、既存著作物との依拠性が認められるかは以下のフローチャートに従って判断すべきと考えます。
　　
　したがって、パターン4においても、AI利用者が既存著作物を認識しつつ、当該既存著作物と同一・類似のAI生成物を生成する意図の下にAIを操作している場合（AI利用者による依拠）がある場合には依拠性が認められ、AI生成物の生成・利用ともに著作権侵害になります。
　また、AI利用者において、そのような認識や意図がない場合であっても、パターン4においては、対象著作物が学習用データに含まれていることから、原則として「AIによる依拠」があることになり、依拠性が認められ、AI生成物の生成・利用ともに権利制限規定の適用がなければ、著作権侵害に該当します。

イ　著作隣接権

　既に述べたように、AIを利用して既存の実演と同一類似の実演を生成する行為は、当該既存実演の「録音」と言えないことから、パターン4におけるAI実演の生成・利用は著作隣接権の侵害に該当しません。

ウ　パブリシティ権

（ア）　AI利用者の責任

　まず、追加学習を自らは行っていないAI利用者の責任については、先ほどのパターン3と同様に考えれば良いと思われます。
　一方、自ら追加学習を行っているAI利用者は、AI開発者としての責任（学習に関する責任）とAI利用者の責任（生成・利用に関する責任）の両方を負う可能性があることになります。

（イ）　AI開発者の責任

　パターン4においてはパターン3と異なり、AI学習に特定著名人の声データが利用されています。
　この場合において、AI開発者がパブリシティ権侵害の責任を負う可能性がある根拠は2つあります。具体的には「AI利用者によるパブリシティ権侵害行為の侵害主体としての責任」「AI利用者Ｙによるパブリシティ権侵害行為の幇助責任」です。この点については設例解説の中で説明します。

（7）生成・利用パターン5

　パターン2と同様、人の声データをAIに入力して、当該声データと同一・類似の声データ（AI生成物）を生成するパターンです。ただしパターン5においては、当該特定の人物の声データが学習（追加学習）に用いられてるものとします。

ア　AI利用者の責任

　著作権、著作隣接権、パブリシティ権いずれについても、パターン2と同様に考えればよいでしょう。

イ　AI開発者の責任

　パターン5においてはパターン2と異なり、AI学習に特定著名人の声データが利用されています。
　この場合において、AI開発者がパブリシティ権侵害の責任を負う可能性がある根拠は2つあります。具体的には「AI利用者によるパブリシティ権侵害行為の侵害主体としての責任」「AI利用者Ｙによるパブリシティ権侵害行為の幇助責任」です。この点については設例解説の中で説明します。

■　まとめ

・　生成・利用段階は5つのパターンに分かれ、著作権・著作隣接権・パブリシティ権について検討が必要。
・　特に、実演家の実演が、生成AIを用いて生成された場合に著作隣接権を侵害するかについて議論が分かれている。

歌手・声優の「声」と生成AI（3）に続く。

【脚注】

1
本記事で検討する設例においては、いずれも対象となるゲームデータや楽曲データの利用について当事者間に契約は存在しないものとします。
2
張睿暎「生成AIと著作者及び実演家の権利」獨協法学122号（2023年）、安藤和宏「音声の法的保護に関する一考察」髙部眞規子ほか編「切り拓く——知財法の未来（三村量一先生古希記念論集）」（2024年、日本評論社）、佐藤豊「生成AIによる実演の学習、実演類似のものの生成及び生成結果の利用に対する規律の一考察①」コピライト760号（2024年8月）、佐藤豊「生成AIによる実演の学習、実演類似のものの生成及び生成結果の利用に対する規律の一考察②」コピライト761号（2024年9月）」、田邉幸太郎「生成AI時代における「声」の保護に関する検討」髙部眞規子ほか編『切り拓く ― 知財法の未来三村量一先生古稀記念論集』（2024年、日本評論社）」など。
3
中山信弘「著作権法（第4版）」（有斐閣）Ｐ691
4
ただし、佐藤豊「生成AIによる実演の学習、実演類似のものの生成及び生成結果の利用に対する規律の一考察②」コピライト761号（2024年9月）」44頁は、生成されたものが特定人による実演であると認識される場合に、元の実演の具体的な特定を要しないことを明確にする推定規定の新設等を前提とした上で、⑤⑥⑦も理論的には実演家の権利侵害に該当する可能性があるとします。
5
あまり想定されませんが、当該著名人の知名度が低く、一部の人しか知らない場合などが②に該当すると思われます。
6
柿沼太一「AI技術により自動生成された人物肖像の利用によるパブリシティ権侵害」（法律時報2022年8月号　通巻 1180号）
7
パターン4，5の場合、AI利用者だけではなくAI開発者も、AI生成物の生成について規範的行為主体としての著作権侵害の責任や幇助責任を負う可能性がありますが、ここではAI利用者の著作権侵害責任のみ検討対象とします。

知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】

ブログ/ BLOG

歌手・声優の「声」と生成AI（2）～生成・利用段階での利用～

4　生成・利用段階における「声」の利用

（1）　生成・利用段階において問題となるパターン

（2）　生成・利用段階における声データの利用行為の分類

（3）　生成・利用パターン1

ア　著作権

イ　著作隣接権

ウ　パブリシティ権

（4）　生成・利用パターン2

ア　著作権

（ア）　入力

（イ）　生成

（ウ）　利用

イ　著作隣接権

（ア）　入力

（イ）　生成

（ウ）　利用

ウ　パブリシティ権

（5）　生成・利用パターン3

ア　著作権

イ　著作隣接権

ウ　パブリシティ権

（6）　生成・利用パターン4

ア　著作権⁷

イ　著作隣接権

ウ　パブリシティ権

（ア）　AI利用者の責任

（イ）　AI開発者の責任

（7）生成・利用パターン5

ア　AI利用者の責任

イ　AI開発者の責任

■　まとめ

関連記事

カテゴリー

NEW

人気記事

ブログ/ BLOG

4 生成・利用段階における「声」の利用

（1） 生成・利用段階において問題となるパターン

（2） 生成・利用段階における声データの利用行為の分類

（3） 生成・利用パターン1

ア 著作権

イ 著作隣接権

ウ パブリシティ権

（4） 生成・利用パターン2

ア 著作権

（ア） 入力

（イ） 生成

（ウ） 利用

イ 著作隣接権

（ア） 入力

（イ） 生成

（ウ） 利用

ウ パブリシティ権

（5） 生成・利用パターン3

ア 著作権

イ 著作隣接権

ウ パブリシティ権

（6） 生成・利用パターン4

イ 著作隣接権

ウ パブリシティ権

（ア） AI利用者の責任

（イ） AI開発者の責任

（7）生成・利用パターン5

ア AI利用者の責任

イ AI開発者の責任

■ まとめ

関連記事

カテゴリー

NEW

人気記事

4　生成・利用段階における「声」の利用

（1）　生成・利用段階において問題となるパターン

（2）　生成・利用段階における声データの利用行為の分類

（3）　生成・利用パターン1

ア　著作権

イ　著作隣接権

ウ　パブリシティ権

（4）　生成・利用パターン2

ア　著作権

（ア）　入力

（イ）　生成

（ウ）　利用

イ　著作隣接権

（ア）　入力

（イ）　生成

（ウ）　利用

ウ　パブリシティ権

（5）　生成・利用パターン3

ア　著作権

イ　著作隣接権

ウ　パブリシティ権

（6）　生成・利用パターン4

イ　著作隣接権

ウ　パブリシティ権

（ア）　AI利用者の責任

（イ）　AI開発者の責任

ア　AI利用者の責任

イ　AI開発者の責任

■　まとめ