続いて山本が取り組んだのは、現実世界からペルソナ像を取得する未来的な実験です。
従来の自律エージェントでは事前に定義したペルソナを使用しますが、この実験では現実世界からペルソナを作成するという新しいアプローチを試みました。
ここで登場するのが、マルチモーダルAIです。
「従来のAIはそのほとんどがシングルモーダルAIであり、スパムメールのフィルターなどがこれに当たります。一方、マルチモーダルAIは、視覚や聴覚、センサーから得られる情報を統合し、認知空間に合わせて推論する仕組みを持っています。これは人間の思考の流れと酷似しており、メガテック企業は汎用AIを実現するための手法として研究を加速させています」(山本)
山本はこのマルチモーダルAIを用い、スマートフォンに保存した動画から自身や家族のペルソナログを取得し、それぞれのモデルを作成。「夏休み、どこに旅行に行く?」というトピックを与えて対話をさせた結果、「米国イエローストーン国立公園」という最終回答が得られました。
(1) スーパーバイザーから「夏休みにどこに行きたいのか、見解を述べよ」と山本モデルに質問。
(2) サラダを食べている画像により“健康志向”のペルソナを持つ山本モデルは、キャンプやビーチなどのアクティビティを希望。
(3) 家族モデルから「ハイキングやサイクリングを楽しめるイエローストーン国立公園がいいのではないか」という、山本モデルの“健康志向”を踏まえた意見が出る。
(4) 山本モデルからライターに「イエローストーン国立公園で楽しむためのアクティビティを調査せよ」と指示。
その後もスーパーバイザーが問いかけを行い、結果をライターがまとめ、最終回答がアウトプットされました。
「AIに自律性が生まれることで、生産性の向上を超えた、大きな価値を創出することにつながります。機能を単純利用するだけでも作業の効率化には非常に大きなメリットがありますが、そこから脱却し、AIとどのように向き合い、組み込むのかという観点が、今後のビジネスにおいて重要なポイントになるでしょう。
技術が日々進化する中で、現在から未来を予測するのは困難です。しかし、今あるテクノロジーの本質を捉えることで、この先に生まれてくる世界観を予測することはできます。大切なのは、未来は描くものであるという認識を持ち、その未来を実現するために今ある道具をどう組み合わせるのか、それを検証することです。それこそが、未来を創り出す上で最も重要なポイントだと我々は考えています」(山本)