企業にとってひとつの製品の成功体験は、ビジネスの成長をもたらすとともに、その後のイノベーションの妨げとなりかねない諸刃の剣の側面がある。初代iPhoneから始まったタッチ操作中心のスマートフォンの隆盛は、後に誕生したアプリストアの「すべてのことにアプリがある」というスローガンとともに、ある種のデファクトスタンダードとなり、日常的に使うモバイルデバイスに関する固定観念を消費者のみならずデジタル機器のメーカーにも植えつけた。そのため、スマートフォンを拡大したタブレットデバイスや、縮小したスマートウォッチ、あるいはパーソナルコンピュータの操作環境を3次元空間に拡張するビジョン・プロのような製品は登場したが、ユーザーとアプリの関係を根本から見直すパラダイムシフトは起こらなかった。
「CES 2024」で突然のデビューを飾った新興企業ラビットの「r1」は、この状況を打開し、人とモバイルデバイスの新たな関係性をもたらす可能性を秘めた製品と言える。
デザインは、先進的な電子楽器のメーカーとして知られるスウェーデンのティーンエイジ・エンジニアリングが手がけ、類を見ないオレンジ色の筐体に、タッチスクリーンとスクロールホイール、ラビット・アイと呼ばれる360度回転するカメラ、プッシュ・トゥー・トークボタン、スピーカー、マイクを備えている。ティーンエイジ・エンジニアリングに製品デザインを依頼したことからも、ラビットという企業の非凡さがわかるが、完成形も他に類を見ないものに仕上がった。一見すると親指でボタンを押したりホイールを回す右手専用の形状に感じられるが、実際には左手で持った場合にも、裏から人差し指で操作できるように考えられている。
r1は、いわゆるアプリを持たず、ユーザーは基本的に、側面のプッシュ・トゥー・トークボタンを押してトランシーバーのように話しかけるだけで、必要な処理を済ませることができる。また、ラビット・アイが捉えたイメージを解析して、ミュージシャンのポスターから対応する楽曲を再生したり、冷蔵庫の残り物からレシピを提案することも可能だ。こうした処理は、プロによる複雑なビデオ編集や3Dのモデリングなどとは異なるが、ごく普通の人々が日常的に行う検索やコミュニケーション、各種サービスの利用などをカバーしている。
その仕組みは、専用のラビットOSと融合した生成AIがユーザーの意図を解釈し、検索結果の表示や、ウーバーの依頼、旅行プランの立案と手配、あるいは音楽配信サービスへのリクエストを行うというものだ。チャットGPTのような生成AIは、大規模言語モデル(LLM)による応答はできるものの、実際の依頼や手配を行うことはできない。そこでラビットは、独自の大規模アクションモデル(LAM)を開発して、実際の処理までカバーできるようにしたのである。
また、あらかじめプリセットされていないWebサービスやWebアプリとの連携も、ユーザー自身がLAMの学習モードを使って、実際に操作の見本を行うことで可能となる。これを利用すると、例えばr1に希望を伝えるだけで、好みの画像生成AIを使ってイラストを描かせたりすることもできる。学習モードの対象は、モバイルアプリも含めて、アクセス可能なものであれば事実上すべてのWebサービスやWebアプリに対応できるという。
r1は、単なるビジョンでもプロトタイプではなく、3月から199ドルで出荷開始されるリアルなプロダクトであり、CESの6日間だけで6万台を受注したとされている。チャットGPTを開発したオープンAIのサム・アルトマンCEOが昨秋にアップルの元デザインディレクターだったジョナサン・アイブが設立したデザインファームのラブ・フロムを訪れ、打ち合わせを行ったといわれているが、考えられるのは、やはり何らかの生成AIデバイスの相談であった公算が強い。
2024年は、他のプレーヤーも含めて、AIネイティブ世代のための生成AIデバイス元年となりそうだが、ラビットr1はその台風の目のような存在といってよいだろう。