英国RCAの学生による 画像生成AIに現実との接点をもたらす
「プロンプタック」ツールキット

画像生成AIは、自然言語のテキストによる指示(プロンプト)のみでリアリティのあるイメージをつくり出すという、画期的な成果をもたらした。しかし、生成結果は、必ずしも利用者の意図が100%反映されたものにならず、特に微妙な色やテクスチャー、あるいはディテールのニュアンスの指定をプロンプトによって行うことには限界がある。

英国ロイヤルカレッジ・オブ・アート(RCA)の院生であるザオディ・フェンは、この問題を「プロンプタック」と呼ばれるツールキットによって解決しようとしている。プロンプトとタクタイル(触覚性)を組み合わせた名前を持つプロンプタックは、造形クレイとシリコン製の外装のなかに、それぞれの機能に合わせたセンサー類を内蔵するワーキングプロトタイプであり、利用者の手の動きや実物の素材の属性を画像生成AIに反映することができる。

例えば、ソフトセンサーと呼ばれるツール群を使うと、生成済みのイメージに対して、つまんだり、捻ったり、曲げたり、握りつぶしたりといった効果を加えた結果を、AIに再生成させることが可能となる。それらの効果の度合いは、指先を使ってアナログ的にコントロールできるため、プロンプトだけでは難しい造形の修正を行いやすくなるという発想だ。

また、フィンガーチップコントローラーはカラーセンサーとRFIDセンサーを備え、対象物の色やテクスチャーを読み取って生成画像に反映することができる。現時点でテクスチャーは、暫定的に当該情報を記録してあるRFIDタグから取得しているが、将来的にはテクスチャー自体を直接的に読み取れるようなセンサーで置き換えられていくだろう。

さらに、プロンプタックで得られた情報は、現状では、いったんプロンプトに変換されて画像生成AIに渡されるが、AI研究者の協力を得て、プロンプト変換なしに両者をつなぐ技術開発も視野に入れているという。

プロントタックのようなツールが実用化されれば、画像生成AIは、デザイナーにとってより使いやすく有用なものとなり、デザイン業務の一翼を担う存在へと進化していきそうだ。End