ブログ/ BLOG

  1. ホーム
  2. ブログ
  3. 人工知能(AI)、ビッグデータ法務
  4. クックパッドAI VS 料理好き弁護士対決~弁護士によるAI活用企業訪問記第1回~(ノーカット版)

人工知能(AI)、ビッグデータ法務 料理

クックパッドAI VS 料理好き弁護士対決~弁護士によるAI活用企業訪問記第1回~(ノーカット版)

柿沼太一 柿沼太一

1 「弁護士によるAI活用企業訪問記」とは

当事務所では、現場でのAI活用の課題を掴まえるために、AIを開発・活用している企業を訪問し、各企業においてAIを具体的にどのように活用しているのかや、開発や利用に際しての課題や苦労について、具体的にお聞きする機会を積極的に作っています。
訪問先は他社からご紹介頂ける場合もありますし、雑誌やメディアで拝見した面白そうな企業にダメ元で取材申込をする場合もあります。
後者の場合、変な弁護士と思って頂けるのか結構取材に応じて頂けることがあり、思ってもみなかった大企業の方から色々お聞きできることもあります。
お聞きした内容は非常に興味深いものも多いため、(一部外に出せないものは除外した上で)訪問・取材内容を記事として順次ブログに掲載していくことにしました。
それがこの「弁護士によるAI活用企業訪問記」です。
記念すべき第1回は、料理レシピサービスでは知らない者はいないクックパッド社です。

同社とは、柿沼が恵比寿の本社にお伺いして勝手にキッチンで料理を作るなどの良好な関係を保っており、今回取材申込をさせて頂いたところ、快く応じて頂けました。
ただし、せっかくクックパッド社に行くのにインタビューだけで終わらせてはもったいない。
「料理ができる状況が来れば積極的にバットを振る」が私のモットーです。
そこで、研究開発部の方にインタビューした後に、私の方でその場で料理をし、その料理と料理でないものをクックパッドの機械学習モデル(AI)が正確に認識できるかという「クックパッド機械学習モデル VS 料理好き弁護士」企画も提案してみたところ、これも快く応じて頂けました。

2 取材に先立って

後で詳しく紹介しますが、クックパッド社は機械学習(AI)を利用して料理と非料理を判別するサービスを提供しています。
そこで、熟考の末、以下のメニューを作ることにし(レシピは一部クックパッドの人気レシピを使っています )必要な材料を当日持参しました。
(1) ポテサラとちらし寿司
いずれもカラフルであまり料理っぽくないので。

利用させて頂いたクックパッドの人気ポテサラレシピはこれです。

Cpicon ❤みんな大絶賛のポテトサラダ❤コツあり♫ by rie-tin

つくれぽが1万件を超えているという驚異のレシピ。ジャガイモが煮えた後に湯切りをして1分加熱して水分を飛ばす、などのコツによりとてもおいしいポテサラになっています。

????????????????????????????????????

ちらし寿司の方はこちら。

Cpicon うちのちらし寿司(ばらちらし) by ケチャ&ウル

ポテサラと見た目を似せるために、上の具は変えさせて頂きましたが(済みません)ご飯と混ぜる具はこのレシピのとおり作りました。乾物を使うので少し手間がかかりますが、その分深い味わいでした。
(2) 牛肉ステーキと油揚げステーキと鯖みりん干し

外見が似た3種類を用意してみました。特に油揚げはアップで撮ったら、古毛布とあまり変わらないので、おそらくAIも間違えるはず。
こちらは特に利用させて頂いたクックパッドレシピはありません。
(3) チヂミとフリッタータ

これも両方とも丸いお皿と間違えそう。
(4) きゅうりとトマトのナムル風と・・・・・(秘密)
「きゅうりとトマトのナムル風」と、料理ではないけども、料理に外見がかなり似ているものを用意しました。これをクリアできたら凄いです。

「きゅうりとトマトのナムル風」のレシピはこちら。

Cpicon ごま油風味♡きゅうりとトマトのナムル風 by ぷくっとぷくまる

これもつくれぽ1000件超えのレシピです。
材料が少なく作り方もシンプルなのに、見た目が綺麗でとてもおいしいという、忙しい人にぴったりのレシピ。

3 取材当日

取材当日は朝5時に起きて新幹線に乗り一路、恵比寿のクックパッド社へ。
撮影と料理補助のために当事務所のスタッフ1名が付き添ってくれました。
取材にご対応頂いたのは研究開発部部長の原島純(はらしま・じゅん)さんと同部の染谷悠一郎(そめや・ゆういちろう)さんのお二方です。

私の正面が染谷さんで奥が原島さん[/caption]

■ クックパッド社におけるAIの活用について

○ 柿沼(以下「柿」): クックパッドとAIの組み合わせというと、特にクックパッドのユーザー層の方からすると、割と意外なところもあるんじゃないかなと思います。実際、今のクックパッド社でAIを利用した技術が実用化されているのはどういう部分でしょうか。
○ 染谷(以下「染」):まず、1つ実際に提供しているのが、クックパッドのスマホ用アプリケーション機能の一つである「料理きろく」ですね。AIという言葉の使い方はいろいろだと思いますけど、この「料理きろく」では、ユーザーのスマホ内に保存されている写真が料理写真かどうかを自動で判別して料理写真だけがカレンダー表示などされるという機能です。

「料理きろく」の画面

○ 柿 撮影さえすれば、自動的にそこに表示されるということですね。
○ 染 そうです。ニューラルネット技術を使ったエンジンがその裏で動いてるというところで。
○ 柿 アプリ内にエンジンが入ってるんですか。
○ 染 いいえ、うちのサーバーにエンジンが置いてあって、アプリケーションはユーザーのスマホ内の写真をサーバーに送って結果だけをもう一度返すという仕組みです。
○ 柿 いつぐらいにリリースされた機能ですか。
○ 染 最初のリリースは、2016年12月からです。
○ 柿 リリース後、途中でサーバー上のモデルの追加学習・更新は行っているのでしょうか。
○ 染 それはやっています。ただ、たとえばニュースの分類モデルなんかだと、モデルを毎日更新したりするのですが、うちの今のアプリケーションではそれほど高頻度に更新はしていませんね。世の中の料理の見た目ってそうそう変わらないので。
○ 柿 なるほど。ユーザーからのフィードバックがある程度溜まれば更新するというイメージでしょうか。
○ 染 そうですね。最近そういう意見が多いので、ちょっと改善できるなら改善しようかというプロジェクトが上がって、更新して、という感じですね。これまで2回更新していて現在は3つ目のモデルが動いている状態です。

■ AIの利用場面について

インタビューはキッチンスタジオ2で行いました

○ 柿 いろいろなアプリなどを開発する場合、普通のルールベースで処理するのか、機械学習とかニューラルネットワークを使うかという振り分けをしますよね。その振り分けは、会社内部でどのような議論を経て決まるものなのでしょうか。
○ 染 つまり、例えばアプリケーションに入れるときに、それを機械学習でするかどうかですよね。
○ 柿 そうですね、例えばさっきの「料理きろく」というアプリを開発する流れですね。例えば研究開発部から「これ、機械学習でできるよ」という話だったのか、あるいは上から指示があって、機械学習でできないか、みたいな指示が研究開発部にあったかということです。
○ 染 理想的なストーリーとしては、まずサービス開発部から、こういうことをAIで実現したいという要望が研究開発部に対して出てくるというのがあります。
○ 柿 はい。
○ 染 その要望に対して、研究開発部が持っている現状の最新技術であるとか、あるいは開発中の技術で実現できそうですね、ということで開発に着手するというのが理想的です。今回の「料理きろく」についても、結構その形に近いものでしたね。
○ 柿 なるほど。
○ 染 もう少し付け加えると、サービス開発部がそういう要望を研究開発部に出してきた背景には、弊社のマクロの経営方針として、サービスに機械学習を使っていこうという話があるんです。なのでサービスに機械学習を使うという大きな方向性があった上で、サービス開発部からの要望があったということですね。

■ どうやって正確に料理・非料理を判別できるようにしたのか

○ 柿 今回、モデルの生成に際して大量の料理の写真はもちろん使いましたよね。
○ 染 はい。
○ 柿 あとは「料理っぽいけど、料理じゃない写真」も使って学習させるんですか。
○ 染 そうですね。
○ 柿 あんまり秘密なことは言わなくていいですけど。
○ 染 今、ちょっと言葉を選んでいます(笑)。やはり特定のカテゴリーについて、「料理じゃないけど料理っぽい」というものは多少あるんですよね。
○ 柿 なるほど。
○ 染 例えば植木ですとか。あれ、植物の集まりなので。
○ 柿 サラダみたいな。
○ 染 そう、サラダみたいに見えるんだろうなということは予測できるんですけど、実際はどうかわからないですが。あとは、動物が写真の真ん中にちょこんと写ってるような写真は、実は質感とか色とかが料理に何となく似てしまうことはあるんですよね。そういうのを見つけて、そういうカテゴリーが危ないよねという当たりをつけた上で、そういう写真は違うと、さらにチューニングを工夫してみて。そういったカテゴリーについては強くなったよねって実証していきます。
あと、こういう「料理っぽいけど料理じゃないものを除外できるか」という指標が1つと、もう1つ「誤って判定されたときのインパクトの大きさ」という指標があります。
○ 柿 どういう意味ですか。
○ 染 例えば、開発者がモデルの精度を計測するときって、計測用の1万枚のテストを流してみて、何%正解するかということをやるんですけど、ユーザーにとって間違って判定されると嫌なものについては重み付けを変える必要があります。
○ 柿 ああ、なるほど。単純な正解率は98%だけど、あとの2%で物すごいものが出ちゃったらまずいという話ですよね。誤認識があったときの不快なインパクトということですね。
○ 染 そう。同じ98%でもこっちのほうがいいということは絶対あるんですよね。だからその辺は難しいですね。
○ 柿 なるほど。たとえばペットが食べ物と判定されたらユーザーにとってとても嫌なんでしょうね。

■ その他のAI活用場面


○ 柿 「料理きろく」以外の機能として、機械学習とかニューラルネットワークを使ってるものってありますか。
○ 染 あとはユーザーが保存したり投稿したレシピが、主菜かデザートかなどの自動分類を機械学習を使ってやっていますね。
○ 柿 それは、レシピというテキストを使えばそんなに難しくはないんですか?
○ 染 機械学習を使わないルールベースでの判別の場合は、例えば幾つか魚の名前を用意しといて、その名前がタイトルなり材料に入ってたら魚料理とか、いろいろやりようはあるんですけど、実は機械学習のようにきちんと統計的に学習したほうが精度がよいものができるという感覚があります。
○ 柿 ただ、魚の名前といっても、同じ魚でも全く呼び名が違うものがありますよね。データベースだと全部登録しとかないとだめだけど、機械学習だと何となくというか、統計的に処理できるということですか。
○ 染 はい。もちろん、実際にアウトプットを比べてみたら、ルールベースでも十分機能するじゃんということは問題によっては結構あるんですよね。ただ、それって要は当たりをつけることを繰り返すことなので、そうじゃなくて、たくさんのデータから学習をさせるほうが、大体において精度が上回ることが多いですね。
○ 柿 例えば分類をするときに、レシピのテキストを見て機械学習で分類してるのは、何を見て分類してるんですかね。
○ 染 非常にいい質問ですね。そこも機械学習をやるエンジニアの工夫の見せどころではあるんですけど、例えばレシピの中から名詞だけを全部持ってきて、このレシピにはこういう名詞は幾つというのを、そのレシピの特徴とするわけです。その場合、片仮名で書かれたり平仮名で書かれたりとかの表記揺れも当然あるんですけど、それぞれがデータとして十分にあれば大丈夫です。
○ 柿 データの量がですね。
○ 染 そうですね。そのデータの量として、例えば片仮名の「サバ」と平仮名の「さば」で表現されたレシピがそれぞれ100個単位であれば、データの量で押し切れるというのがあって。1つの手法としてはそういう感じです。あとは名詞をカウントして、同じ名詞を全部の辞書から、こっちのレシピでは3回出た単語がこっちのレシピでは1回出てるとか、そういうことですね。
○ 柿 なるほど。
○ 染 また動詞も入れてみるとかですね。
○ 柿 逆に言うと、例えば魚レシピはこの名詞が多いとか、この動詞が多いみたいな感じなんですかね。
○ 染 そうですね。実際に学習にかけるときは単語数だけではなく、名詞、動詞の関係とかも見えるようになるので。例えばこっちとこっちが多いとか、こっちが多くて、この単語は多くて、この単語は余り出ないほうがいいとか、その辺も学習の結果としては出てくるはずで。そこを分析するのって結構難しいですよ、後から分析するのは。
○ 柿 学習してみるときに、ここに注目して学習してねということは人間が設定しないといけないんですよね、今のところは。
○ 染 はい、今のところは。ただ、分類するためのいろんなモデルがあるんですけど、そのうちの幾つかについては、例えばこれらを分類するのに、物すごくよく効果のある単語みたいなのが学習の過程でわかってくるモデルがあって。
○ 柿 この単語が出てきたらこうだみたいな。
○ 染 例えば「しょうゆ」という単語が出て来たらスイーツではないとかですね。しょうゆの入っているスイーツなかなかないので。
○ 柿 なるほど。
○ 染 そういうのは何となく見えてくることはありますね、単語ベースですけど。

■ クックパッドにおけるAI開発体制について

○ 柿 今、社内でAIの開発と研究をやってらっしゃる部は、研究開発部ですね。
○ 原島(以下「原」) はい。
○ 柿 これは2016年7月から正式な部ができたということですね。最初、研究開発部が立ち上がったときって、何人で立ち上げたんですか。
○ 原 総勢5名ですが、開発にフルコミットしていたのは僕と染谷さんと山田さん。僕と、新卒でいきなり入ってきた2人だけという、ある意味物すごいメンバーでした。
○ 柿 原島さんは、バックグラウンドというか、機械学習とか深層学習は、入社までに御経験があったんですか。
○ 原 機械学習自体は、もともと大学の研究室がそういう研究室だったのでやってました。ただ、深層学習に関しては、僕がちょうどエンジニアになったころに流行り出したので。。。多分機械学習のすごい古典的な話だったら僕のほうが詳しいと思うんですけど、深層学習はむしろ染谷さんのほうが詳しいかもしれません。画像とかだったら絶対染谷さんが詳しいですし。
○ 染 深層学習については、もう完全にうちの部はゼロベースで始まっていますね。
○ 柿 現在の研究開発部は正社員の方が6名ですね。研究開発部内では、研究員各自がそれぞれ違う研究をやってらっしゃるということですかね。
○ 染 そうですね。一部、さっきやった「料理きろく」のモデルのアップデートとかは、何人かがまとまって同じ課題に取り組むみたいなことあるんですけど、基本的には結構分散してますね。
○ 柿 印象的には割と手が足りないというか、忙しくてしようがないという感じですかね。
○ 原 はい、忙しくてしようがないです。
○ 柿 研究に対していろんな要望が出てきてて、それを実現するのに作業レベルの手が足りないという話なのか、それとも大きな、もう少し高度な話を考えるような人が足りないという話なのか、両方ですかね。
○ 原 両方ですね。作業レベルもそうですし、大きな絵を描くのもそうですし。あともう一つは、我々の部、立ち上がったばっかりで、採用にすごく時間をかけてるので、そこもありますね。採用であるとか広報であるとか、そういったところも業務のうちに入りますので。一人一人がいろんなことをやらないといけないので、そういうことをもろもろ鑑みると人手が全然足りないとかですね。

■採用活動について

○ 柿 現在、どういう方法で研究人材の採用活動をされてるんですか。
○ 原 会社として、やっぱりいろんなイベントを開催してというところから来てるのもありますし、社員にうちの会社にあう人を紹介してもらったこともあります。別にすごく特別なことしてるわけではないですね。
○ 柿 なるほど。今は世界的にAIの関係のエンジニアが足りないようなイメージがあるんですけど、そういう印象はありますか、やっぱり。
○ 原 業界として盛り上がっているので、そういう傾向はありますね。
○ 染 大学時代から機械学習関連で成果出しまくってる人をピンポイントで採用しようと思うと、もちろん難しい。ただ現実には「データ分析寄りのノウハウがあるエンジニア」みたいなところで探していってみたいな感じになります。
○ 原 あと、染谷さんとか多分そういうタイプだと思うんですけど、もともと一般的なエンジニアリングがすごくできる人が、機械学習とかやってみると結構おもしろくて、そっちもやろうみたいな人もいるかもしれません。
○ 柿 なるほど。
○ 染 今、そういうパターン結構いると思うんです。
○ 原 もしかしたら、そっちを狙うべきなのかなと。
○ 柿 普通の、って言ったらあれですけど、エンジニアリングから1つの手法として機械学習を使えるという人を採用しに行くということですね。
○ 原 はい。
○ 染 今、業界でAI人材が足りないと言っているのは、恐らくですけど、機械学習関連の研究室にいるスペシャリストみたいな人はもともと数が少ないこともあって、全然そこには人がいないという話はあると思うんです。
○ 原 ただ、プロダクション開発において実際に機械学習や深層学習を導入することを考えると、染谷さんみたいに、もともとエンジニアタイプの人のほうがむしろ合ってるんじゃないかなと思いますね。
○ 柿 なるほど。機械学習とか深層学習のツールとか、かなりコモデティ化してきていますものね。
○ 原 そうですね。動かそうと思ったら、別に大学からやってなくても動かすことはできるというか、そこから学んでいけるのもあるので、そういった人を狙っていくというのがいいと思うんですよね。
○ 染 その辺は多少、ゲームのバランスが変わってますよね、最近。
○ 原 はい。
○ 柿 染谷さんは、もともとは大学で何をやってらっしゃったんですか。
○ 染 僕はコンピューターサイエンスの専攻で、プログラミング言語の理論の研究とか、そんな感じのことをやってました。
○ 柿 クックパッド入られたのはいつですか。
○ 染 去年の4月で、その後3カ月間、研修があったので、2016年6月まで研修をして、7月に研究開発部に配属されました。
○ 柿 機械学習とかは、大学では専門としては別にやってなかったんですね?
○ 染 すごく掘り下げた基礎みたいな部分はもしかしたら共通する部分だったかもしれないですけど、いわゆるデータベースでの機械学習の経験は全くなかったですね。
○ 柿 ただ研究開発部に入ると、機械学習の分野をやるという話に当然なるわけですよね。
○ 染 そうですね。
○ 柿 それは興味を持って取り組めたのですか。
○ 染 興味はありましたね。ただ、当時配属されたときのミッション感としても、やはりさっきもあったんですけど、実際にモデルを動かす部分を中心にやっていくということで、実際にそういうところとやっぱりメーンで見ていました。
○ 柿 じゃあ、それは染谷さんの力を生かせるという感じだったんですね。
○ 染 そうですね。
○ 柿 なるほど。クックパッドに入ろうと思ったのは何でですか。
○ 染 エンジニア業界の中では、クックパッドって結構技術的なリソースが豊かな会社だというイメージがすごくあって、実際周りの人から色々な話聞いて、ここでやっていきたいなと
○ 柿 なるほど。技術的リソースというのは人も含めてですか。
○ 染 そうですね。人と環境と。あとは、やっぱり大規模に実際もう使われてるサービスを持ってるところが大きいかもしれないですね。
○ 柿 なるほど。
○ 染 ユーザー獲得からやっていかないといけないというのは結構大変なので。

■技術的なキャッチアップについて

○ 柿 機械学習はすごく技術的な進歩が早い分野だと思うんですけど、キャッチアップする工夫はされてますか、皆さん。
○ 染 そうですね。確かにすごく早くて、僕の個人の話ですけど、すごく早くて全部キャッチアップするのはやっぱり無理なので。とはいえ、割とレイヤーは浅く、こういうことができるようになりましたみたいな情報はあるんですよね。実際にこれはこういう判別ができるような技術ができて、こんなことができるよねというレイヤーの話が結構、情報量としては軽いので、その辺はキャッチアップをしておいて、その中で理解しておかなければいけないような技術については深堀りをしておくことでやると、それなりに無理なくキャッチアップできるかなというところですね。
○ 柿 なるほど。
○ 染 全部読みはちょっと無理ですね。
○ 柿 興味ある部分は深堀りして論文を見たりということですね。
○ 染 そうですね。

■料理とAI

○ 柿 今、AIの研究とか機械学習とか開発をして苦労している点は何かありますか。特に料理というジャンルであるがゆえの難しさというか。
○ 染 難しさというか、料理というデータって結構、実際研究の対象になることも多くて。
○ 柿 あ、そうなんですね。
○ 染 何でかというのは予想でしかないですけど、画像と名前とあと手順、さらに手順に写真もついたりして、構造としてはかなり興味深いデータなんです。実際に手順というデータがあって、その完成品が料理なわけですから、そこには明確な構造がある。この手順を踏めるとこのものができるというのと、さらにその写真とタイトルがついてるということで、物すごく興味深いデータである反面、結構その構造が複雑ではあるんですよね。そこを生かし切るためには、なかなかやることがたくさんあるなというのはあります。
今でこそ料理の写真を分類する部分をメインで動いてますけど。例えば何だろうな。それこそ、この手順とこの手順は似てる、このレシピとこのレシピが似てるとか。
○ 柿 例えば、レシピの自動生成みたいなものは、将来的には可能かもしれないということですね。
○ 染 そうですね。
○ 柿 料理方法は手順と材料の組み合わせですもんね。基本的には。

■ 開発環境

○ 柿 今のクックパッドの開発環境について、もし可能であれば教えていただけますか。
○ 染 研究開発でフレームワークって結構種類はいろいろあるんですけど、その辺は特にチームとして、これを使っていこうというのは決めていませんね。
○ 柿 個々の人が好きなものを選択しているんですね。
○ 染 はい。むしろその好きなものを使える状況を部としてアシストしてるということです。その辺とかは僕が担当しています。
○ 柿 得意なフレームワークとかあれば教えてあげたり、ここはこっちのほうが向いてるよという話ですかね。
○ 染 そうですね。あとは結構、機械学習系のフレームワークって計算集中的なフレームワークで、そういう場合に何が起こるかというと、インストールが難しいという現象がたまに起こるんですよね。
○ 柿 そうなんですね。
○ 染 その辺は、難しいものについては都度アシストするのは余りないですけど、きちんと配備を入れれば動くような状況にしておいてあげるとかはあります。
あとは環境ですけど、うちはプロダクションでAMAZONのWEBサービスでクラウドのサービスを使って全部アプリケーションが動いているわけですけど、機械学習もそこで実はやっていて。アウトサービスのよさを利用してというか、必要な分だけ計算機を用意して、その上でいろいろ実験ができるようにしてあるとか。
○ 柿 学習用データについては、ユーザーから投稿された料理データを利用規約にしたがって利用しているということですね。
○ 染 そうですね。
○ 柿 ほかにWEB上にあるようなものを収集することはありますか。
○ 染 あまりないですけど、学習のためには「料理っぽいけど料理じゃない写真」って必要じゃないですか。そういうパブリックな植木の画像セットを使ってはたまにありますね。

■ データ収集とモデル生成について

○ 柿 データを集めてきて、自分のところで学習してモデル作るところまで一気通巻にやっている企業もあれば、前半だけ、あるいは後半だけやっている企業もありますよね。
○ 染 ありますね。
○ 柿 僕がよく相談を受けるのは、医療AIなんです。たとえば画像から病変を発見するようなAIですが、そういう場合当然画像データは病院にしかないです。そして病院はモデル生成はできないので、どこかの企業にデータを提供してモデルを生成するんですよね。そしてモデルができ上がったときに、どっちのものだみたいな話もあるんですよ。それって今のところ契約で決めるしかないんですけど、クックパッドさんの場合そういうことはないですよね、今のところは。
○ 染 ないですね。ただ、今後は増えてくるのは予想できますね。さっきも言いましたが、機械学習の世界で料理の研究ってすごく活発で、うちのデータも一部、学術目的で利用できるようなパブリックデータを公開してたりはするんです。そういうデータを利用した別の大企業が開発を行う、というようなパターンは今後はもしかしたら出てくるかもなというのはあります。ただ、データとモデルが分かれてしまったときにどう考えるべきかということはよく分かりませんね。
○ 柿 そうでしょうね。クックパッドさんのように自分でデータを大量に持っていればそういうこともないですけど、大体そんなことはないので、データをモデルが分かれてしまってデータを持ってるほうが強い、みたいな話は今は結構ありますね。
○ 染 でも片方はデータに興味があって、片方はその分析した結果に興味があるとなるとなかなか難しいですね。
○ 柿 そうでしょうね。そこは法律的にもなかなかやっかいな部分です。これで私がお聞きしたいと思っていたことは終わりです。長時間、ありがとうございました!

■ いよいよ挑戦

インタビューも無事終わり、いよいよ私がクックパッドAIに挑戦する時間が近づいてきました。すこし時間はさかのぼるのですが、その部分についての私と染谷さん、原島さんとのやりとりです。

○ 柿 料理と料理でないものを認識するAIということですが、苦手な分野はどこですか。
○ 原 苦手なところで言うと、例えばサラダとかは普通の植物みたいだと間違われてしまう部分もあるので、そういったものは難しいかもしれないですね。
○ 染 難しいですね、多分。
○ 柿 一応、お電話でそうお聞きしたので、今日特別なものを準備してきております。サラダの材料と、あと鉢植えの花です!

秘密兵器である「鉢植えの花」

○ 染 (困惑した表情で)。。。。。。これは相当難しいと思いますね。
○ 原 花は相当むずい。
○ 柿 でしょうね(嬉)。赤い花ですけど。サラダは「きゅうりとトマトのナムル風」です。いや、ちょっとこれは相当難しそうだなと思いながら(嬉)。

○ 染 いや、これは。。。もしうまくいったら凄いですね。。。
○ 原 結構厳しい気がしますね。
○ 柿 そうでしょうね(嬉)。
○ 原 はい。
○ 柿 あとは、いくつか料理を作る予定で材料とかを全部準備してきました。これは似た料理ということで一応持ってきたので、よろしくお願いいたします。

(と言うわけで原島さん、染谷さんにはシステムの準備を開始していただきました。私の方も料理を開始。)


フリッタータ用ズッキーニをソテー

(約1時間の料理後。。。)

左がちらし寿司、右がポテトサラダです。
結構似ていますよね。

これも似ている同士の焼き物三連です。上から牛ステーキ、鯖のみりん干し、油揚げの焼いたの。ちなみに染谷さんは実験の後の試食で、鯖のみりん干しを人一倍食べていました。

フリッタータとチジミ。
野菜たっぷりなのでどちらもよく似ています。
あとは最大の難関であるサラダと鉢植えの花(嬉)。

全ての料理を目の前にしてにこやかな原島さんと染谷さん。

勝てる自信があるのか、単に空腹なだけか。。。

いよいよ判別です。
まずポテトサラダから。

左が元画像で、右がシステムにより処理をした画像です。いわゆるヒートマップなのですが、赤い色が濃い部分が「料理っぽい」と判定された部分でして、この処理画像を見ると見事に料理として判定されています。

次にちらし寿司とポテトサラダの比較画像。なぜかポテトサラダよりちらし寿司の方が料理っぽい」と判定されていますね。
かなり精度が高いです。強敵です。クックパッドAI。
あきらめずに次は焼き物3連。

うーん。これも、ステーキ、鯖のみりん干し、油揚げすべて料理であると判別されていますね。
これだとあまり面白くない。。。。
いや、ちょっと待って下さい!
一番下の油揚げの焼いた奴は、ちょっと料理っぽさがないと判定されています。赤い部分は、左端の添え物部分だけで、油揚げ本体については料理判定されていないような気がします!
相手の弱いところを見つけたら、そこを徹底的に攻撃するのが弁護士の仕事なので、さらに挑戦してみました。

油揚げの焼いた奴のアップ写真です。
これは無理でしょう。
いや、実際のところ、たとえば日本人以外の人がこの写真を見たら「毛布」「チャウチャウ犬の皮膚」などと判断する可能性があります。
では処理してみましょう。

ダメ!ゼンゼン!
完全に料理判定されてしまいました。
残されたのはサラダと鉢植えの花のみ。
まずサラダ。

ダメですね。
完全に料理判定されました。
最後は鉢植えの花。
これは原島さんも染谷さんも全く自信なさげだったので絶対に行けるはず!
これが元写真です。

秘密兵器である「鉢植えの花」

どうでしょうか。。。

これもダメ、全然。
まったく料理として認識されていません
この判定結果を見たクックパッドのお二人は歓声を上げて「スゴい!スゴい!」と喜んでいました。
確かにすごい。

実は、この企画、実際にクックパッドAIで判定してみて、結果があまりにダメだった場合には、この企画そのものがボツになるのではないかとドキドキしていた私も非常に安心しました。もちろん最初からクックパッドAIを信じていましたけどね。

と言うわけで、「クックパッドAI VS 料理好き弁護士」は私が完敗ということで終わりました。今度はもっと「料理っぽくない料理」を研究して挑戦したいと思います。
ちなみに、作った料理は研究開発部のお二人と私たちでは食べきれず、クックパッド社の他の社員の方にお裾分けしました。

今回の企画では、クックパッド社がAIを自社事業に非常にうまく活用していること(ちなみに今後の開発予定についても詳細にお聞きしましたが、それは秘密ということで)、染谷さんや原島さんのような優秀なエンジニアが意欲を持って仕事をすることで、IT企業であるクックパッド社を支えていることがよくわかりました。
クックパッドの皆様、ありがとうございました!
またお伺いします!

【AIビジネス法務・知財セミナー(基礎から応用まで)のご案内】
AIビジネス法務・知財セミナー(基礎から応用まで)を大阪(9月)、東京(10月)、福岡(12月)で開催いたします。
現場で実際に問題となる事例を厳選し、AIや知財の基礎から応用までじっくり解説する4時間です。
プログラム(予定)は以下のとおりです。
過去の参加者の声や申込、詳細はこちらのページからどうぞ。

【プログラムの内容(予定)】
第1 AIの基礎
第2 AIと法律・知財に関する問題領域の概観~AIの適法な生成、保護、活用、法的責任~
第3 AIの生成に関する法律問題
1 様々なデータ(個人情報を含むデータ、著作権を含むデータ、肖像権を含むデータなど)を利用してデータセットや学習済みモデルを生成する場合の問題点
2 医療画像など個人情報を含んだ生データやデータベースから適法に学習用データセットや学習済みモデルを生成するには
3 第三者が著作権を有している生データやデータベースから適法に学習用データセットや学習済みモデルを生成するには
4 学習用データを収集するデータ作成者とAI学習を行う者が異なる場合、データ作成者からAI学習を行う者に対して学習用データを提供できるか
5 ウェブ上に公開されている学習済みモデルに独自データを入力して新しいモデルを生成した場合、その新モデルは自由に利用してよいのか。
6 共同開発や業務委託の形式で、データの提供を受けてモデルを生成する場合、学習済みモデルはデータ提供者とモデル生成者のどちらのものになるのか~実際に使える契約条項の検討~
第4 AIの保護に関する法律問題
1 学習用データセット・学習済みモデルを保護する3つの方法(技術、契約、法律)
2 学習用データセットの保護
3 学習済みモデルの保護
(1) AIoTの場合
(2) AIaaSの場合
第5 AIの活用~AIが自動的に生成したものを法的に保護するにはどうしたらよいか~
1 AI生成物の分類
2 AI生成物の保護
(1) AI著作物(著作権)
(2) AI発明(特許権)
(3) AI意匠・AI商標(意匠権、商標権)
(4) AI営業秘密・ノウハウ(不正競争防止法)
(5) その他の出力(製品の異常検知、スマートピッキングロボット、市場予測、投資判断、医療AIによる画像診断)
3 諸外国での例
第6 AI活用による法的責任について
1 基本的な考え方
(1) AIが何らかの機器に搭載されて提供されている場合
(2) AIが純粋なプログラムとして提供されている場合
2 具体例
(1) コンテンツ生成AIが既存コンテンツと同一コンテンツを「偶然」生成したら
(2) 医療用AIが判断ミスをしたら
第7 質疑応答

フォローいただくとブログ更新を見逃しません↓

STORIAへのお問い合わせやご相談はこちらから