人工知能(AI)、ビッグデータ法務
AIを利用したシステム開発を受託したベンダが絶対に知っておくべきポイントと具体的契約条項
この記事は「AI法務Q&A~AIの生成・保護・活用に関する法務Q&A~」のうちのQ&Aの1つです。
Q&Aの全体像については「AI法務Q&A~AIの生成・保護・活用に関する法務Q&A~」をご参照ください。
「AIを利用したシステム」の開発は、これまでのシステム開発と異なる点があり、特にベンダ側が知っておくべきポイントが何点かあります。
【AIシステム開発に際してベンダが知っておくべきポイント】
1 まずは「できないこと」をはっきりさせ、ユーザーの期待値のコントロールをする
2 成果物に関する権利の取り扱いが一番のポイント
3 生成した学習済モデルについて蒸留行為や派生モデル生成行為をすることがOKかNGか
4 モデル生成のためにユーザーから提供を受けるデータの取り扱いに注意する
5 システム障害が生じたときの責任分担が不明確になりがちなので要注意
この記事では、ユーザーとベンダがシステム開発契約に関する交渉をするときに最も問題になりやすい「成果物に関する権利の取り扱い」について説明をします。
目次は以下のとおり。
通常のシステム開発と対比させているので、わかりやすいと思いますよ~。では行きましょう!
【本記事の目次】
1 AIシステムにおける「成果物」
2 通常のシステム開発の場合をまず押さえる
3 AIシステム開発の場合はどうか
(1) 納品するかどうかと権利がどちらに帰属するかは別問題
(2) 契約で権利の所在を明確化する必要が高い
(3) データセットについて
(4) 学習済みモデルについて
ア 派生モデルの生成を許すのか
イ 蒸留行為の禁止
ウ 自社にモデルの権利を残すのであれば、モデルが営業秘密として保護されるように、相手にも縛りをかけておく必要がある
(5) 具体的条項例
1 AIシステムにおける「成果物」
通常のシステム開発における成果物は「プログラム」ですが、AIシステム開発における成果物はプログラム以外にも存在します。
たとえば、ユーザーから大量の生データの提供を受けて、ベンダ側でデータセットを作成、当該データセットを用いて学習を行って学習済みモデルを生成して、当該学習済みモデルを組み込んだプログラムを作成して納品する、という場合を考えてみましょう。
ここで「ノウハウ」とあるのは、生データからデータセットを生成する過程、及びデータセットから学習済みモデルを生成する過程においては、様々な「職人技」が必要であり、その際にベンダが従前保有している独自のノウハウが使われる、あるいは新たなノウハウが生じることがあることを示しています。
ここで生じている成果物、すなわち「データセット」「学習済みモデル」「モデルを組み込んだプログラム」「ノウハウ」について、ユーザーとベンダがそれぞれどのような権利を持つかについて契約において明確化する必要があるのです。
2 通常のシステム開発の場合をまず押さえる
この点について考える前に、通常のシステム開発の場合に、成果物(プログラム)に関する権利がどのように扱われるかについて押さえておきましょう。
先ほど述べたように、通常のシステム開発の場合の成果物はプログラムです。
プログラムは著作権法上の「著作物」ですから、システム開発契約においては必ず、プログラムについてユーザーとベンダがそれぞれどのような権利を持つかについて明確化する必要があります。
(1) デフォルトではベンダ側に著作権が発生
著作権法上、「著作者」とは「著作物を創作する者」とされていますので(著作権法2条1項1号)、システム開発の場合、プログラムを作成したベンダが著作者であり、ベンダ側でプログラムの著作権が発生します。
(2) 成果物をいくつかに分けて権利の帰属を検討する必要がある
ここから先は様々なバリエーションがあるのですが、作成されたプログラムについて、もう少し分解して考える必要があります。
ユーザーから依頼されてベンダが作成したプログラムには以下の4つが含まれているのが通常です。
1 新規に制作し、当該用途のためだけに利用されるプログラム等
2 新規に制作し、今後使い回し可能な(汎用的な)プログラム等
3 従前から保有していたプログラム等
4 利用許諾を受けて利用している第三者のプログラム等
ユーザーからは、1~3全てについて著作権を自社に譲渡するように要請があるかもしれません。
しかしベンダとしては、2,3、4については今後も自社において再利用することを当然予定しているでしょうから(4についてはそもそも第三者のものなので譲渡ができません)、2,3,4については自社に権利を留保したいところです。
その場合、システム利用に必要な範囲においてのみの非独占的利用を許諾することになります。
そのため、ベンダは以下のような状態を目指してユーザーとの間で交渉をしていきます。
具体的には、1については著作権を譲渡するが、2,3,4についてはベンダ側に権利を留保したままで(ベンダ側が著作権者のままで)必要な範囲でユーザに使用を許諾するということです。
このように、通常のシステム開発においては「1 新規に制作し、当該用途のためだけに利用されるプログラム等」「2 新規に制作し、今後使い回し可能な(汎用的な)プログラム等」「3 従前から保有していたプログラム等」「4 利用許諾を受けて利用している第三者のプログラム等」それぞれについて、権利(著作権)をベンダからユーザーに譲渡するのか、権利をベンダに留保してユーザーに利用許諾をするかについての契約交渉が行われることになります。
3 AIシステムの場合
さて、通常のシステムの場合の成果物に関する権利をどう扱うかが分かったところで、AIシステムについて検討をしましょう。
先ほど述べたように、AIシステムについては成果物が複数あります。
整理してみます。
(1) 納品するかどうかと権利がどちらに帰属するかは別問題
先ほどの「一般的なシステム」と同様、これらの各成果物に関する権利をユーザーに譲渡するのか、ベンダ側に権利を留保して利用許諾するのかについて明確にしなければなりません。
ただし、注意すべきなのは、納品するかどうかと権利がどちらに帰属するかは別問題だということです(これは通常のシステムでもAIシステムでも同じです)。
契約によっては、プログラムのみを納品する場合もあるでしょうし、データセット、モデルとプログラム全てを納品する場合もあるでしょう。また,契約によっては、開発過程において生じた新たなノウハウについても提供して欲しい、という場合もあるかもしれません。
そのように、「何を納品するか」というのは契約によって異なるのですが、「納品した成果物に関する権利がユーザーに全て移転する」「納品していない成果物に関する権利は全てベンダに留保される」という訳ではないことには注意が必要です。
これは、通常のシステム開発においても、プログラムは納品しますが、そのプログラムに関する著作権がユーザーに移転するかベンダに留保されるかは別問題であることからも分かると思います。
特にユーザー側の発想からすると「成果物を納品して貰った以上、この成果物に関する権利は全て譲渡を受けた」と思いこむことが多いし、その思い込みによるトラブルも沢山あります。
したがって、「納品するかどうかと権利がどちらに帰属するかは別問題」であることをユーザー・ベンダ双方が理解しておく必要があります。
(2) 契約で権利の所在を明確化する必要が高い
仮に納品した成果物の権利の所在が契約で明確に決まっていなかった場合はどうなるのでしょうか。
プログラムの場合は「著作物」であることが著作権法上明記されていますので、プログラムの創作者であるベンダのところでまず著作権が発生するのが法律上のデフォルトルールです。
そして、ベンダの元で発生した著作権について「ユーザーに移転すること」が明確に契約で定められていなければ、そのままベンダのところにプログラムに関する著作権は残っていると解釈されることが多いと思います(もちろん、交渉経緯や対価の多寡にもよるのですが)。
一方、学習済みモデルの場合は簡単ではありません。
というのは、学習済みモデルは通常、著作権法上の「著作物」ではないと考えられているからです。
したがって、プログラムのように法律上のデフォルトルールが決まっていません。
学習済みモデルについては、データを提供したユーザーの元に権利が発生するのか、 データセットやモデルを生成したベンダの元に権利が発生するのかは、当事者間の合意・契約だけで決まることになります。
そのため学習済みモデルに関する権利の所在が契約で定められていない場合、当該モデルがユーザー・ベンダのどちらに帰属しているかは非常に不明確になります。
したがって、AIシステム、中でも学習済みモデルについては、契約で権利の所在を明確化する必要が特に高いのです。
それでは、以下「データセット」「学習済みモデル」「モデルを組み込んだプログラム」の順番で見ていきましょう(「ノウハウ」については無形的なものですので、特に契約上で取り扱いを定めなければノウハウを取得した側にノウハウが残るだけです)。
【データセットについて】
データセットについては、編集方法によっては「データベースの著作物」と評価される可能性があります。
その場合はデータセットを作成したベンダの元で著作権が発生することになりますが、さすがにベンダが他目的に流用するということをユーザーが許諾するはずがありませんので、全ての権利をユーザーに移転させることがほとんどだと思います。
【学習済みモデルについて】
学習済みモデルについても、通常のプログラムと同様、全ての権利を譲渡するか、権利をベンダの元に留保してユーザーに利用許諾をするかの選択肢があることになります。
ベンダとしてはできれば汎用的なモデル部分については権利を自社に残したいところです。
ただし、学習済みモデル特有の問題点が何点かあります。
ア 派生モデルの生成を許すのか
モデルを可視的な形で納品した場合の問題ですが、汎用的なモデル部分についてベンダ側に権利を残してユーザーに利用許諾をした場合、ユーザーに派生モデルの生成を許すのか、という問題があります。
「派生モデルの生成」というのは具体的には、生成した学習済みモデルに別の訓練データを用いて学習させ(ファインチューニング)、異なるモデルを生成する行為です。
仮にモデルが「著作物」だとすれば、派生モデルの生成行為は著作権法上の「翻案」行為になるのですが、先ほども言ったようにモデルそのものは著作物ではありませんし、元モデルと派生モデルは全く違うパラメーターになっているので、「翻案」ともいえないと思われます。
ですので、ここでも契約できちんと「ユーザーに派生モデルの生成を許すか否か」についての扱いを決めておく必要があるのです。
イ 蒸留行為の禁止
また、モデルそのものを納品せず、コード化したオブジェクトコードを納品する場合はユーザーは、そのままではモデルを他用途に利用することなどができません。
もっとも、その場合でも、いわゆる「蒸留」により、別モデルを生成することができます。
「蒸留(distillation)」とは、学習済みモデルにデータの入出力を繰り返すことで得られる結果を基に学習することを言い、一から学習済みモデルを作成するよりも効率的に同様のタスクを処理する別の学習済みモデルを作成することができるとされています。一種のリバースエンジニアリングです。
学習済みモデルが「著作物」であり、「蒸留」が当該学習済みモデルの「複製」に該当すれば、著作権法に基づいて蒸留行為の差し止め等が可能ですが、モデルは著作物でもありませんし、「蒸留」は「複製」でもありません(蒸留は、学習済みモデルそのものを複製しているのではなく、入力データと出力データを用いて、別のモデルを構築しているだけだからです)。
したがって、「蒸留をしてもよいかどうか」についても契約上明記する必要があります。ブラックボックス化して納品している以上、当然「蒸留行為をしてはならない」と明記することになるでしょうね。
ただ、実際問題としては「蒸留行為をしてはならない」と明記したとしても、実際に蒸留行為が行われた場合、元モデルとの関連性を証明するのは難しいでしょうから、責任追及が難しいという問題は残ります。
ウ 自社にモデルの権利を残すのであれば、モデルが営業秘密として保護されるように、相手にも縛りをかけておく必要がある
また、自社にモデルの権利を残す場合、モデルが「営業秘密」として保護されるようにしておく必要があります。
学習済モデルを法的にどのように保護するか、という点については現在様々な議論がありますが、不正競争防止法上の「営業秘密」としてであれば保護できる、という点についてはほぼ確実です。
もっとも、「営業秘密」として保護されるためには一定の要件があり、その要件を満たさずに納品してしまった場合には、「営業秘密」には該当しないことになってしまいます。
自社内で開発した時点では「営業秘密」だったものも、顧客に納品することにより「営業秘密」に該当しなくなり、保護されなくなる可能性がある、ということです。
不正競争防止法上、「営業秘密」として保護されるためには、以下の3つの要件が必要です。
1 当該情報が秘密として管理されていること(秘密管理性)
2 有用であること(有用性)
3 公然と知られていないこと(非公知性)
2の「有用性」は当然存在しますので、問題になるのは1の秘密管理性と3の非公知性です。
この点を満たすために、契約において必ず設けておかなければならない条項があります。
それは「納品するモデルがベンダの営業秘密であることを明記すること」「ユーザーによるモデルの第三者提供を禁じること」「ユーザーに秘密保持義務を課すこと」です。
具体的な条項の記載の仕方は以下で紹介します。
【具体的条項例】
【注意事項】
・ 自己又は自社内でのビジネスのための利用は問題ありませんが、それ以外の態様(セミナーでの利用や第三者への頒布等)での利用を禁止します。
・ 契約書雛型についてSTORIAはいかなる保証もおこなわず、雛型の利用に関し一切の責任を負いません。
・ 雛型に関する著作権その他の一切の権利はSTORIAに帰属しており、雛型の利用の許諾はかかる権利の移転を意味するものではありません。
以下、モデル及びプログラムを可視的な形で納品し、モデルやプログラムに関する権利をベンダに留保したうえで、一定の利用をユーザーに許諾する場合の条項例(関連する部分のみ)をご紹介します。
第★条 納品
1 受託者は、開発した学習済みモデル及びモデルを組み込んだプログラム(以下両者をまとめて「本成果物」という)につき、納期までに、納入場所に納入するものとする。
2 受託者は、本成果物の納入に際し、委託者に対して、必要な協力を要請することができるものとし、委託者は受託者から協力を要請された場合には、速やかにこれに応じるものとする。
第★条 学習済みモデルの利用許諾
1 本成果物のうち学習済みモデルに関する知的財産権等一切の権利(データベースの著作物に関する件を含むがこれに限られない)は受託者に帰属する。本契約において明示した場合を除き、本契約の締結によって、受託者は委託者に対して学習済みモデルに関する何らの権利も譲渡、移転、利用許諾するものではないことを相互に確認する。
2 委託者は、受領した学習済みモデルが、受託者において営業秘密(不正競争防止法2条第6項に定めるものを言う、以下同じ)として管理されている情報であることを確認する。
3 受託者は、委託者に対し、学習済みモデルを、本契約の有効期間中、当事者双方が別途合意する目的(以下「本目的」という)の範囲内で利用することを許諾する。
4 委託者は、受託者による事前の書面による承諾なくして、学習済みモデルについて以下の行為を行ってはならない。
(1) 前項に定める目的の範囲外での一切の利用
(2) 加工、編集
(3) 異なる学習用データを用いた派生モデルの生成
(4) 蒸留(学習済みモデルにデータの入出力を繰り返すことで得られる結果を基に学習すること及びその類似行為)
(5) 第三者提供
1項:学習済みモデルに関する権利はベンダに留保し、一定の利用のみユーザーに許諾することを明確にしています。
2項:納品した学習済みモデルが、不正競争防止法上の「営業秘密」として保護されるべく、ユーザーにその点を明確に認識させるための条項です。
3項:ユーザーが学習済みモデルを利用できる範囲について定めた条項です。ここでは「当事者双方が別途合意する」とありますが、もちろんこの契約の中で定めても構いません。たとえば「委託者が●●の名称で第三者に提供するウェブサービスの提供のために学習済みモデルを利用すること」などが考えられます。
4項:すでに説明したように、学習済みモデル特有の問題として「派生モデルの生成を許容するか」「蒸留を許容するか」という点がありますが、この条項ではいずれも禁じています。また「第三者提供」も禁じることにより、学習済みモデルが「営業秘密」として保護されるようにしています。
第★条 プログラムに関する権利
1 本成果物のうちプログラムに関する著作権(著作権法第27条及び第28条に定める権利を含む、以下同じ)は、検収完了時に受託者より委託者に移転する。ただし、受託者又は第三者が本契約締結前から保有していたプログラムまたは汎用的な利用が可能なプログラムの著作権は、受託者又は当該第三者に留保される。
2 受託者は、委託者に対し、本目的の範囲での使用に必要な限度で、前条但書のプログラム(第三者に著作権が帰属するものを除く)の利用を許諾する。
3 受託者は、委託者に対し、本成果物に含まれるプログラムに関する著作者人格権を行使しない。
ですので、通常のシステム開発契約と同じ内容です。本契約では「新規に制作し、当該用途のためだけに利用されるプログラム等」のみ譲渡し、その他のプログラムについては受託者に権利が留保されることにしています。
第★条 委託者の義務
委託者は、本成果物のうち学習済みモデルを、他の情報と明確に区別し、善良な管理者の注意を持って取り扱うと共に、関連法令に従い、自己の営業秘密と同等以上の管理措置を講じるものとする。
4 まとめ
1 AIシステムにおける「成果物」は「データセット」「学習済みモデル」「モデルを組み込んだプログラム」「ノウハウ」がある。
2 通常のシステム開発の場合をまず押さえる。
3 AIシステム開発の場合はどうか
(1) 納品するかどうかと権利がどちらに帰属するかは別問題であることに注意。
(2) モデルは著作物ではないので、契約で権利の所在を明確化する必要が特に高い。
(3) データセットについては権利を譲渡するのが通常。
(4) 学習済みモデルについては「ア 派生モデルの生成を許すのか」「イ 蒸留行為の禁止」「ウ 自社にモデルの権利を残すのであれば、モデルが営業秘密として保護されるように、相手にも縛りをかけておく必要がある」点に注意。
(5) 具体的条項例
(弁護士柿沼太一)
なお、その他のQ&Aについては「AI法務Q&A~AIの生成・保護・活用に関する法務Q&A~」をご参照ください。