レポート

2025.10.08

うねりの泉編集部

リアルワールドAI:データから現実世界へ(海野裕也氏 登壇) / SPECTACLEs2025 レポート

リアルワールドAI:データから現実世界へ(海野裕也氏 登壇) / SPECTACLEs2025 レポート

「SPECTACLEs 2025」は2025年7月14日〜17日に開催された、unerry主催のビッグデータカンファレンスです。本記事は「リアルワールドAI:データから現実世界へ」のセッションを書き起こしでレポートします。(実際の発言から意図に変わりのない範囲で編集を加えています)

登場人物

株式会社Preferred Networks リテール担当VP
海野 裕也

大手IT企業の研究所を経て、2011年に前身となるPreferred Infrastructure、2016年よりPreferred Networksに入社、2022年よりリテール担当VPに就任。自然言語処理、機械学習、ロボティクスの研究開発を経て、小売業向けにAIやロボットを利用したソリューションMiseMiseの開発に従事。著書に『オンライン機械学習』『深層学習による自然言語処理』

株式会社unerry 執行役員CSO(チーフエヴァンジェリスト)
今泉 ライアン

米国アメリカン大学卒業後、1997年PwCコンサルティング入社。金融チームにて従事。その後ベンチャー企業設立・経営、モルガン・スタンレー証券、UBS証券、みずほ証券で新規事業立ち上げ、海外拠点連携等、マネージング・ディレクターとして、グローバル・プロジェクトを牽引。

※役職はイベント当時

リアルワールドAIとは何か?なぜ今重要なのか

(unerry)今泉:
こんにちは。unerryの「SPECTACLEs」へようこそ。今泉ライアンと申します。本セッションにはPreferred Networksの海野様にご登壇いただきます。よろしくお願いします!

(PFN)海野:
はい、よろしくお願いします。

(unerry)今泉:
早速ですが、今回のセッションのテーマは「リアルワールドAI」です。海野様はこのテーマについてどのようにお考えでしょうか?なぜ今この言葉が重要なのでしょうか?

(PFN)海野:
この数十年、AIに限らずIT分野で最も伸びてきたのはインターネットやデータベースのような、コンピューターの中で起こっているところかと思います。

一方で、人々の経済活動や普通の生活というのは必ずしもコンピューターの中だけで起こっているわけでは、当然ないですよね。

インターネット上の購買とオフラインによる購買を見てみると、ECって確かに伸びてはいる。すごく伸びてはいますが、全体で言ったらまだ10%に満たないわけです。

購買の9割はやはりオフラインで起こっていて、大きな経済活動があるし、人々の暮らしというものがある。そういう部分に、いかにAIや新しい技術が入っていくかが、これから大事になっていくんじゃないかと思っておりまして、今日「リアルワールドAI」のテーマでお話させていただくことにしました。

(unerry)今泉:
「リアルワールド」というと、多くの方は多分ロボットとか自動運転とかを思い浮かべると思います。たとえば最近だとNVIDIAも「フィジカルAI」といったキーワードを強調しますよね。

(PFN)海野:
ロボティクスや自動運転車のような現実の物理世界の中で動くもの、物理世界の中で動くAIって非常に重要になってきているんですよね。

ただ、今日私がお話する「リアルワールド」は、必ずしも物理世界というだけではないことをお伝えしたいと思っています。

たとえば、先ほどの個人の購買活動は、物理というよりは個人の商取引みたいな部分ですよね。

今日は、インターネットとかコンピューターの中で起きる以外の、さまざまな意思決定や現象みたいなものを「リアルワールド」と表現して、扱っていこうと考えています。

たとえば、弊社では「MATLANTISMatlantis|原子レベルの現象を予測するAIシミュレータ)」というサービスを作っております。これは何やっているかっていうと、原子のシミュレーションなんですね。

原子のシミュレーションって何かっていうと、たとえば鉄とか酸素とか水素のような原子は、すごくミクロな世界で反応してるんですが、これくらい小さくなってくると、いわゆるニュートン力学の、ボールを投げてキャッチするといった力学じゃなくて、シュレーディンガー方程式って呼ばれる量子力学の世界になってくるんですね。

そこまで来ると、中で何が起こっているかを正確にシミュレーションするのが非常に難しくなります。ただ、それが起こっているから化学反応が起こったりとか、たとえば電池などがいろんな素材からできている。こういうのが、現実世界で起こっている現象です。

そして、これも若干宣伝なんですが、私のチームでは「MiseMiseMiseMise)」という小売業様向けのサービスを作っています。たとえば、お客様がお店でモノを買う時に「どれを買おう」とか、従業員の方が作業する時にも「この商品出さなきゃ」といった意思決定を細かいところでたくさんしているんですが、こういうのもやっぱり現実世界で起こっている現象だと思っております。

unerryさんが扱っている人流データも、まさに現実世界で起こっている現象のデータですが、今お話しした例は、インターネットだけを見てても全然わからない。さまざまな法則を、AIがどうやって扱えるようになっていくかが結構重要になってくる。そういうイメージで捉えております。

AIが現実世界を扱えるようになった背景:「データ駆動のAI研究」の変遷

(unerry)今泉:
なるほど。複雑なこの現実の世界を、なぜAIで扱えるようになってきたんでしょうか?

(PFN)海野:
まず、AIが進化する過程でいうと、AI研究自体は実はすごく古くて1950年くらいにまで遡っちゃうんですよね。この70年間でどう移り変わってきたかを振り返ってみると、実はすごく重要なのが「データ駆動のAIの研究」になってきた、っていうことがあります。

「データを使う」というのは、みなさんよく聞くと思うのですが、これは思ったより最近で、90年代くらいから主流になってきます。逆に言うと、それより前は、「データを使う」というよりも、中の仕組みをうまくモデル化してあげるとか、そっちの方が割とメインストリームだったんですね。なんでかっていうと、端的に言うとデータがなかったんですね。90年代くらいまで。

私の専門でもある自然言語処理の研究トレンドでいえば、90年代くらいっていうのは、新聞のデータをみんな使っていたんですね。この界隈の人たちは、ウォールストリートジャーナルと毎日新聞のデータにめちゃくちゃ詳しい。本当に特定の毎日新聞の95年のデータを必ず使うんですよ。当時ってそれしかデータがなかったから。

そして90年代に何が起こったかというと、皆さんご存知の通りWindows95が出ました。インターネットがブームになって、Eメールとかワールドワイドウェブのデータがインターネット上にたくさん出てくるようになった

そうなると、「こういう研究をやりたいからデータ作る」っていうよりは、「こういうデータが生まれた、新しい研究できるぞ!」っていう感じで、どちらかというと「データができたからこの研究が始まる」みたいに、データに翻弄されながら研究が進む。

そして、当然この先にはSNSがあって、SNSの研究がめちゃくちゃ流行ったんですよね。

ちょっと有名で面白い話があるんですが、Eメールのデータって実は作るのすごく大変で、秘匿情報が非常に多いんです。でも、アメリカのエンロン社が破綻した時に、「どういうやり取りをしたかのEメールのデータを全部出しなさい」ということになったんですね。その「エンロン・コーパス」っていうEメールのデータセットが自然言語処理界隈で結構有名で、それのおかげでEメールのやり取り、人々のコミュニケーションのやり取りの研究ができるようになったわけです。

そんな感じで、どんなデータを使えるかがAI研究を駆動する、といったこともあるんですね。

(unerry)今泉:
いろんなデータが先にあって、それをどう解析したり分析するかの技術が後から生まれてきた。それでAIの発展がどんどん進んできた。そういうイメージなんですかね?

(PFN)海野:
おっしゃる通りですね。「これやろう」っていうよりも先に、「データが来たからこれやろう」がこの数十年ずっと続いてきた。そこで、「すごくコストかけてデータを作ったら研究進むじゃん!」みたいな話になってくるんですよ。

2009年の論文で「ImageNet」という巨大な画像のデータセットをスタンフォードが作りました。このデータセットを使って画像認識のコンペをやったんですね。その時にめちゃくちゃ伸びたのが深層学習という手法です。2012年に深層学習がもともとあった手法を全部一気に追い抜いて、それ以降「深層学習すごい」となりました。

教師なし学習と基盤モデルの本質

(unerry)今泉:
最近のトレンドである生成AIやその基盤モデルは、このデータとの関係性ではどういった位置づけになるのでしょうか?

(PFN)海野:
今一番ホットですよね。みなさんもChatGPTやGeminiとかを多分使われていて、日常生活にも使うような世界観になってきたんですよ。これは本当に、この5年くらいのトレンドです。

「この本質ってそもそも何なの?」という話をさせていただきたいと思います。この絵はヤン・ルカンっていう深層学習で非常に有名な研究者の人が出した「ヤン・ルカンのケーキ」って言われる絵なんですけども…

先ほどお見せした「ImageNet」など深層学習が非常に流行った頃は、いわゆる「教師あり学習」と言われる、人間が正解をたくさん教えてあげるとAIが賢くなるよっていうパターンなんですよ。

大量に教えてあげるためにめちゃくちゃコストかけてデータを作って、すごい計算機回したらうまくいきましたよね、というのが2010年頃に起こりました。当時の感覚からすると、「たくさん正解を教えてあげることが、学習の本質だよね」ってみんな思っていました。

2016年にヤン・ルカンがキーノートスピーチで話していたことは「正解を教えるのではなく、正解がないところから学習することの方が知性の本質である」という指摘です。「ケーキの本体は、教師なし学習である」と、そういうようなことを話しています。

で、今流行っているLLMや基盤モデルと言われるものは、基本的に手作業のアノテーション(テキスト、音声、画像などのデータにタグやメタデータと呼ばれる情報を付与する作業)が要らないところで学習しています。

手作業で正解を教えなくても、データさえあれば勝手にAIが賢くなってくれるので、膨大にあるデータセットとAIの相性がめちゃくちゃいいんですね。

そう聞くと、「大量にデータがあれば賢くなるのは当たり前」と思われるかと思います。考え方自体は、もちろん2010年より前からあったのですが、当時は実はそんなに性能が上がらなかったんですね、すごくコスパが悪かった…。

頑張って計算したのに、ちょこっとだけ性能上がるくらいの感覚だったのが、2020年頃になると、あるところで急激に性能が伸びることがわかった。

急激に性能が伸びるので、皆さんが使っているLLMみたいな感じで、お金をかけて計算機を回してAIを学習させる。そういった感じの、流れに今はなっています。

AIの進歩に欠かせないインターネットのデータが使い尽くされている

(unerry)今泉:
なるほど。インターネットという巨大なデータソースがあり、それを燃料にずっとフィードしてきたわけですね。

(PFN)海野:
そうですね。巨大なデータがこの2、30年くらいでどんどん積み上がって、それを使うと学習できることがわかりました。それによって今までは個別に学習しなきゃいけなかったものが、一回学習したLLMが全部解いちゃう。基盤モデルとして機能することがわかってきたと。

一方で、インターネットのデータを使う量が増えていくと、今度は「インターネットのデータが尽きかけている」っていうことが問題になっています。

https://icml.cc/virtual/2024/poster/33903

2024年の国際会議で出ていた論文の図なんですけれども、緑のラインがインターネット上にあるデータの量。LLMの学習に使っているのが青のラインで、「このままいくと全部データを使い尽くしてAIの進歩、止まるよ」っていう指摘がされています。

インターネットデータの限界と、リアルワールドの新たなチャンス

(unerry)今泉:
インターネット上の燃料が尽きかけているって、深刻な問題ですよね。

(PFN)海野:
あんなに大量にあったのに、尽きるのかなと。

今後どうしていくのか?ということで、実はすごく重要なチャンスがあると自分的には思っています。つまり、インターネットの外で。

いわゆるリアルワールド(現実世界)にあるような情報ですね。先ほど話したような購買行動や原子、人流データもそうですが、他にも人間の感覚で言えば、たとえば味覚とか触覚みたいな身体感覚みたいなものは、当然インターネット上に直接はないわけですよ。

こういうデータは、仮にインターネットのデータを使い尽くしたとしても、まだ直接的にAIが扱い切れていない。こうした領域に、今後どう挑んでいくのかが、AI研究に今問われているのかなと思っております。

(unerry)今泉:
すごく面白い感覚です。ネット上にないデータを取り扱うイメージができないというか、ちょっと難しそうな印象です。でも、そこには可能性があると、海野さんは思われているってことですよね。

人間の直感をAIが獲得する可能性

(PFN)海野:
おっしゃる通りですね。

この5年くらいのAIの進化、特にLLMとか基盤モデルの研究でわかってきたことの一つが、「人間の直感みたいなものも、データと計算機さえあれば学習することができる」というイメージなんですね。

キャッチボールを思い浮かべていただければと思います。

ボールは放物線を描いて、ひゅって飛んでくるってわかるじゃないですか。あの放物線はニュートン力学で、こう飛んでくるわけですよ。重力が働いてるから下に、かつこのくらいの加速度で…っていうのが背後にあるのですが、そんなの計算しなくても人間はボール取れますよね。キャッチボールの背後にある物理現象とか、さまざまな原理を理解しなくても、直感でボールは取れます。

ボールが放物線を描いて飛んでくることを人は経験によって体得できている。自転車なんかもそうですよね。

これを制御でやろうとすると、裏でたくさん計算させなきゃいけないんですけど、経験だけでそういうことは全部直感的にわかる。それは、人間の専売特許なのかなと思っていたら、AIも大量にデータを食わすと、直感が働くようになってくると。

そうすると、たとえば原子の世界の直感とか、購買の世界の直感とか、そういう現実世界の中で起こる様々な現象に対しても、同じようにAIが直感を得ていくということができる可能性が高いってことなんですよね。

特別なことをやらなくても、大量にデータを食わしたら言語を扱えるようになってしまったということは、他の領域でも同じようにAIの直感が働くようになっていくかもしれない。

現実世界の人々がやっている経済活動とか、生活の部分でも同じように、うまくデータを作ってAIを学習してあげると直感が働いてくる。すると、それに基づいて、コンピューターが何らか答えを出してくれたりとか、何らかサポートしてくれる。

こういうのは起こっても不思議ではない。これから起こっていくのではないかと思います。

(unerry)今泉:
AIが、人間の持つ直観に近づいていくってことは、ビジネスのやり方自体が根底から覆るような大きな変化や、インパクトの可能性があるってことですね。

(PFN)海野:
そうですね。人間だったら全然見切れないぐらいのデータの中、AIが直感を利かせて「次こうなるよね?」みたいなことを返してくれるようなことが起こりうるのかなと思っています。

もちろん、冒頭にあった「フィジカルAI」みたいな、ロボットのような物理世界で主体的に機能する進化も当然起こってくる。労働力不足の問題がありますから、そこもサポートしてくれるだろうし、いろんなところでAIが、これまで解いてくれなかったような様々な領域で活躍するポテンシャルは、まだまだあると思っております。

AIの制約とデータ取得の工夫

(unerry)今泉:
逆にAIはこの辺はどうしてもやっぱり難しいとかチャレンジングだな、っていう部分はありますか?

(PFN)海野:
データが取りづらい部分はチャレンジングになってきますし、データ取得の工夫がもっと大事になってくると思います。

具体的な例で言えば、味覚って、世界中の人が持っていますが、生のデータじゃなくて、辛いとか甘いとか言葉にして皆さん話すわけですよ。直接的な刺激データっていう意味だと今、舌は取れてない。新しいセンサーを開発してデータを貯めていく話になってくると、センサーをどう作るのかとか、どのくらいの粒度でデータ取ったらいいのか、みたいなことをやらないといけなくなってくる。

データの取り方の工夫はすごく難しいんだけど、チャレンジングでもあるし、ポテンシャルもあるかもしれない。そういう感じになってくると思います。

人流データとAI活用の可能性

(unerry)今泉:
なるほど。ところでunerryは人流データの会社ですけども、AIを活用することで、人流データがもっと将来的にうまく有効活用できそうなところは、ありますか?

(PFN)海野:
人流データも、やっぱり非常にポテンシャルがあると思います。

普通に生活してると見えないデータなので「実はこうやって動いてるよ」っていう、AIの直感が働いてくると、次何が起こるかの予測が働いてくる、ということも起こるんじゃないのかなと思います。

(unerry)今泉:
予兆であったりとか、いわゆる”プリディクション”と言われている部分ですね。直感的な機能がAIに備わってくると、我々が今見えないもの、予兆できないものが見えてくる。世界がちょっと広がってくる可能性もあるっていう、そういうことですかね。

(PFN)海野:
そうですね。もちろん、その時に他のデータとの掛け合わせの話も当然出てきますし、人流の情報が他の現象にどう寄与しているかとか、それから人流がこう変わったらどうなるの?みたいなことっていうのも、いろんなパターンのシミュレーションも多分できてくるのかなと思ってます。

小売業界におけるAI活用の展望

(unerry)今泉:
複雑な現実世界で、人間が持っている直感や感覚をAIが獲得する未来はかなり壮大ですよね。ロマンがある世界だと思うんですけども、私たちが今、AIやいろんな技術と日々関わりながら、新しいチャレンジの入り口に立ってるんだなと。

(PFN)海野:
AI活用の最前線は、今まではどちらかというとインターネットをいかにうまく使うかが中心的だったのかなと思っています。インターネットの中にあるデータの方がやりやすかったと。

ただ、インターネットの中でどれだけやっていっても、なかなか現実世界の普通の人々の暮らしに、あんまりアプローチできていないなって感覚もあります。

普通の生活や産業っていうのは、インターネットのデータを扱うよりも、もっと非常に泥臭い。データの取り方だとか、使い方・扱い方が難しい問題が非常に出てくる話かなと思ってます。

自分も小売業様向けのお仕事をさせていただいていますが、やっぱり現実世界は複雑で、たくさんの人の意思決定が絡んでますし、いろんな現象が起こっている。そういうのを一つずつ見ていきながらデータを作らなきゃいけないですし、どう適用するかも考えなきゃいけないですよね。

一方で、そういうところの方が社会全体で見たら非常にボリュームが大きいので、いかにAI活用していくのか、まだ眠っている価値をどうやって引き出していくのかは、非常にエキサイティングでチャレンジングな取り組みになっていくと思っております。

ですので、これからAIが活躍するのはまさにこれからだと思います。今日視聴いただいている皆さんも、各領域の中でどう使い、進化に挑戦していただけるといいのかなと思っております。

(unerry)今泉:
小売業様向けのAI活用に海野さんは関わっていらっしゃいますが、AIを活用したら、どの部分が一番伸びると、今考えられてますか?

(PFN)海野:
まず思うのは、小売店ってやっぱりお客様がやってきて、買い物をすることがベースとしてあるわけですよね。お客様のシミュレーションができるようになると、非常に変わってくるかなと。

たとえば「この商品置いたら売れるんだっけ?」「この商品をどう並べたら一番お客さん買いやすいんだっけ?」とか。実際に商品を並べてみて売れる売れないがわかると思うんですけども、AIがそれが模倣できるようになると、ショッパーの直感をシミュレーションできるようになってくるかなと思います。

そうすると、お店作りの考え方とかも、まず一旦AIに聞いてみよう、みたいなことができると思います。一つはそういう売り場作りみたいなところかな。

もう一つは、従業員の皆様の効率性のところ。「どうすれば一番効率的に仕事ができるのか?」については、すごくサポートしてくれるようになっていくと思います。

日本のロボット技術とAIの未来

(unerry)今泉:
小売の分野でAI活用は進んでいくイメージがあるのですが、日本だと、たとえばロボットの活用も期待できると思います。「日本の強みなんじゃないか?」ってよく僕も耳にすることがありますが、ロボットが小売の中で今後発展していくイメージはありますか?

(PFN)海野:
間違いなくそのロボットは、これから重要な産業になっていくと思います。

というのもやはりですね、小売業では、人海戦術みたいなものが非常に多くて、我々もロボットを作って小売の皆様に使っていただいているんですけど、非常に期待を持たれるというか、早く仕事をやってくれと。どこへ行っても人手不足で採用できないし、高齢化もすごく深刻な状態かなと思っています。

あとはですね、日本のロボット技術は世界的に見てもすごく強い。特に産業用のロボットは一番強いところですね。よく言われることなのですが、日本はロボットがすごく好きっていうことがあって。

本当かどうかわからないんですけど、日本人に「ロボットでイメージするのって何?」っていうと、だいたい「ドラえもん」か「鉄腕アトム」が返ってくると。サブカルチャーの中でポジティブな印象がすごく育まれているんですよね。一方アメリカ人に聞くと「ターミネーター」が出てくるというので、ネガティブな印象を持つ人が多いっていうのは、よく言われることですね。これ本当かどうかわからないですけど。

でも、レストランで動いてるロボットに対する人々の反応を見ていても、結構みんなポジティブになってきているなという感じがありまして。我々もやっぱり同じようにですね、小売店で動くロボットを提供してるんですが、子供が集まってくるというか、ポジティブに見ていただく方は多いと思います。

そういう意味だと、社会にどうやって浸透させるかはすごく重要だと思うのですが、もともとポジティブに捉えられる土台はあるのかなって思っていますね。

(unerry)今泉:
なるほど、そうですね。僕もAIと聞くと、日本はどちらかというと、困ったところを助けてくれる、サポートしてくれるイメージがすごく強いんだけども、海外に行くと、やっぱり自分の仕事を奪われてしまうっていうニュアンスがどうしても強いというのを聞きますね。

いいイメージを日本が活用して、人手不足であったり、いろんな社会課題にAIやロボットを活用していきながら補っていく、もしくは効率化していくのは、本当に日本の強みであると思います。どんどん活用できれば、さらなる広がりをイメージできますよね。

(PFN)海野:
そうですね。日本の人手不足って喫緊の課題という感じです。先進国の中でも高齢化のスピードが早い。ここをどう技術で解決していくのかをしっかりやって、その解決したモデルを世界に発信していく。世界に輸出していくイメージを考えると、ピンチなんだけど、チャンスも眠っているのかなと思います。

(unerry)今泉:
そういう意味ではAIとロボット、日本の技術の最先端をしっかり利用して、グローバルで日本発のビジネスをどんどん広げていくきっかけにしたいですよね。

(PFN)海野:そうですね。それができると非常にいいのかなと思います。

(unerry)今泉:
お聞きしたいことはまだ山のようにあるんですけれども、お時間の関係で今日はここまでにしたいと思います。リアル世界のAI活用は多分これからどんどん進んでいくんだろうとお話を伺って感じましたし、我々の生活がさらに豊かになる可能性が十分にあるなと感じました。

本日はプリファードネットワークスの海野様にご登壇いただきました。海野様、本当にありがとうございました。

(PFN)海野:
ありがとうございました。

この記事を書いたのは

うねりの泉編集部

うねりの泉編集部 記事一覧

うねりの泉編集部です。unerryのとっておきをお伝えしてまいります。

SHARE THIS ENTRY

ABOUT

「うねりの泉」は、「リアル行動データ」活用のTipsやお役立ち情報、そして会社の文化や「ひと」についてなど、unerryの"とっておき"をご紹介するメディアです。

POPULAR

TAGS