【ロボット × 生成AI】OpenAIと業務提携したAGIに最も近い汎用人型ロボット:Figure 01
- 生成AI
- LLM
- テクノロジー
汎用人工知能(AGI)の実現がすぐそこに。人型ロボット Figure01 に OpenAIの生成AIが搭載。
ロボット業界において、工場における部品のはめ込みのような、特定のタスクを行うロボットについては市場飽和するほど開発が進んできました。
一方で汎用的なタスクを行うロボットは、ハードウェア・ソフトウェア両面における技術的な難易度の高さから、日常生活や業務で利用ができる製品はいまだに実現されていません。
Teslaが開発している最先端の汎用人型ロボット「Optimus」は、物体の色と場所を認識して掴み、同色の箱にものを入れることができます。しかし、日常生活や業務で利用できるレベルにあるとは言いがたいのが現状です。
(引用:https://youtu.be/D2vj0WcvH5c)
もし人間と同様の汎用的タスクを実行できるロボットが実現されれば、それはAGI(汎用人工知能)を搭載したロボットと捉えることができます。
今回は、2022年に設立された新興企業でありながら、Teslaと汎用人型ロボットの製品化を競っているスタートアップ「Figure AI」を紹介します。
AGIとは
AGIとは、「Artificial General Intelligence」の略であり、日本語では汎用人工知能と呼ばれています。
具体的な定義は専門家によって異なることもありますが、多くの場合「人間と同様の汎用的な知能を持つ人工知能」のことを指しています。(引用:https://www.softbank.jp/biz/blog/business/articles/202310/what-is-agi/ )
AGIが実現されれば、従来人が行っていた仕事やタスクはAIと代替可能になります。そのため、生身の人間にとって危険な区域での作業も可能になります。
また、AGIと並行して頻繁に取り上げられるワードが「シンギュラリティ(技術的特異点)」です。
シンギュラリティとは、AIが自律的な学習を繰り返していくことで、人間の知能を超える瞬間のことを指します。(引用:https://www.brainpad.co.jp/doors/news_trend/about_agi/ )
シンギュラリティが起こった場合、AGIと同様に人間の仕事のほとんどが奪われる可能性があります。また、人間がAIをコントロールできなくなるのではないかという問題も指摘されており、AIの取り扱いについては倫理的な使い方が求められます。
こうしたAGIやシンギュラリティを実現する可能性のあるロボットが、Teslaの「Optimus」であり、Figure AI の汎用人型ロボット「Figure 01」です。
Figure AIの概要
Figure AI は2022年に設立された、カリフォルニア州に拠点を置くAIロボティクスのスタートアップです。
創業者でCEOのBrett Adcock氏は、空飛ぶクルマとも呼ばれる電動垂直離着陸機(eVTOL)を製造する航空宇宙会社「Archer Aviation」を設立し、27億ドル(約4050億円)の評価額でニューヨーク証券取引所に上場させた実績があります。
また彼が26歳の時に設立した、オンライン人材マーケットプレイスである「Vettery」は、2018年に世界最大の人材紹介会社であるアデコ グループに1億1000万ドル(約165億円)で買収されています。
「米国だけでも安全でない仕事が1000万件以上あるが、高齢化により企業が従業員数を拡大することはますます困難になっている。」
「ロボットが工場から農地まであらゆる場所で『労働力に加わる』ことで、労働力そのものはロボットのレンタル価格と同等になるまで減少し、コスト削減が促進される。」
という見解が記載されています。
Figure AIはロボットを市場に投入することで商品の生産コストを下げ、大量生産を通じて人々の生活水準を向上させることができる、と考えているようです。
AGIの実現に向けた倫理的課題に対処するため、Figure AIはロボットを軍事用途・防衛用途で使用しないことを明言しています。ロボットは、人間が実行したくない仕事や人間による実行が難しい仕事に使用されるとのことです。
同社は2023年5月に、Parkway Venture Capitalより7000万ドル(約105億ドル)の資金調達を実施しています。
当時のXのツイートでは、ロボット開発の加速や社内製造能力の向上、AIデータエンジンの設計、商用アプリケーション化の促進などに使用されると述べています。
また同社は2024年2月、BMWと業務提携することを発表しました。自動車製造にFigure AIの汎用人型ロボットを導入し、人間にとって困難または危険な業務を担うことで、効率と生産性を向上させるねらいがあるようです。
Figure 01の機能
Figure AIの開発する汎用人型ロボットは「Figure 01」という名前が付けられています。
Figure01の機能については、こちらの動画で紹介されています。
Figure Status Update - AI Trained Coffee Demo
デモ動画では、「コーヒーを淹れて」という指示に応じて、Figure 01がコーヒースタンドの蓋の位置を認識して開け、コーヒーの素をセットし、ボタンを押すことでコーヒーを淹れる様子が紹介されています。
(引用:https://youtu.be/Q5MKo7Idsok?si=VbTFgI35Jsrv1_zi )
動画からは、
- 音声による指示を自然言語で理解し、タスクを実行できること
- 目に搭載されたカメラから物体の位置を認識していること
- コーヒーの素をセットすることがうまくできていない時に、正常にセットされていないことを認識して自律的に修正する能力があること(下記画像参照)
などがわかります。
(引用:https://youtu.be/Q5MKo7Idsok?si=Eyr3GSAWWkHjKEzB )
コーヒーを淹れる動作が、大量のデータセットに基づく機械学習によるものと推察されますが、これほどまで細かい制御ができることは驚きです。
機械学習により動作を実現している場合、学習可能なデータセットさえあれば、理論上はどのような動きでも再現できることになります。
生成AIとロボット
Figure AIは2024年3月、OpenAIと資本提携を結んだことを発表しました。
生成AIを活用したヒト型ロボットFigure01の模様が公開=高度なタスク処理が可能に
これにより、Figure01には生成AIが組み込まれていることが明らかになりました。Figure AIは生成AIを搭載したロボットがどのようなタスクを処理できるかについて、デモ動画を公表しています。
Figure Status Update - OpenAI Speech-to-Speech Reasoning
(引用:Figure Status Update - OpenAI Speech-to-Speech Reasoning)
デモ動画では、
- 人間の言葉による指示を、ロボットが文字起こししてタスクを理解する
- ロボットが話すことによって、人間の指示を理解したことを伝達
- カメラから得られるリアルタイムの視覚情報から、人間による指示に基づいて物体を認識
- 指示通りにタスクを実行
という流れで、その場その場の状況に応じてロボットが自律的に動いていることがわかります。
これは、ロボットに一連の動作をさせるために、大量のデータセットで機械学習を行う、というステップが必要なくなることを意味しています。
ロボットに生成AIが組み込まれることによって、AGIが実現される未来がそう遠くないものになっています。3年後には、従来人間が行っていた作業の数十%がロボットに代替されているかもしれません。
まとめ
Figure AIは、AIを用いて汎用人型ロボットを開発しており、動作を学習させることで任意のタスクを実行できることがわかりました。
弊社でもハードウェアに生成AIを組み込み、処理実行コードをリアルタイムに生成することでハードウェアを動かす、というプロジェクトの構想をしております。
また、私たちは大規模言語モデルに専門知識を埋め込む「RAG」という技術や、非構造・半構造のデータを構造化・正規化することに強みを持つ会社です。
それらの技術を活かしたプロジェクト組成やMVP開発のご支援も行っておりますし、「そもそもどのような業務に生成AIを活用できそうか」という上流工程から伴走することも可能です。「情報収集も兼ねて相談したい」というお客様も、お気軽にお問い合わせください。
「生成AIを活用したいが、どういう業務に向いているのかがわからない」
「生成AIに興味はあるが、キャッチアップをしている時間がない」
という方々に向けて、最新記事のアップ時にメールでお知らせさせていただいております。
今回の記事のような内容をタイムリーに知りたい場合は、 ぜひ下のフォームからAI Powered Business Lettersに登録いただければ幸いです。