MENU

人間のように歩くロボットへ:Figure社、強化学習による自然歩行制御を開発

figure.ai
  • Figure社が強化学習で自然歩行を学ぶヒューマノイド制御技術を発表
  • 数千体のシミュレーションで数年分の歩行データを数時間で学習
  • 人間の歩行スタイルを模倣し、速度・エネルギー・安定性を最適化
  • ドメインランダム化とトルク制御で実機へのゼロショット転送が可能
  • 同一ポリシーで多数のロボットが安定歩行、商用スケール化に期待

数年分の動作データを数時間で学習、ゼロショット転送で実機でも安定したヒューマノイド歩行を実現

2025年3月25日、ロボティクス分野で注目を集めるFigure社が、強化学習(Reinforcement Learning, RL)を活用して人間のように歩くヒューマノイド歩行制御技術を発表しました。Figure社の最新ロボット「Figure 02」は、エンドツーエンドのニューラルネットワークを通じて、自然な二足歩行をゼロから学習し、**現実のロボットへの即時適用(ゼロショット転送)**を可能にしています。

この技術の核は、高精度物理シミュレーション環境での大規模並列学習です。数千体の仮想Figure 02ロボットが多様な地形や外的刺激を受けながら歩行を学習し、数年分の試行錯誤をわずか数時間で経験。学習されたポリシー(制御戦略)は、**人間の歩行スタイル(かかと着地、つま先離地、腕振りの連動)**に近づけるため、報酬関数にヒトの歩行軌道の模倣を組み込み、速度やエネルギー効率、外乱耐性も最適化されています。

シミュレーションから実機への移行では、ドメインランダム化高周波トルクフィードバック制御が鍵となります。さまざまな物理条件をシミュレーション内でランダム化し、現実の環境やロボット間の差異に適応可能な汎用性を付与。また、制御信号はkHzレベルでフィードバック制御され、アクチュエータの誤差も補正。結果として、全くチューニングせずに10体の実機ロボットが同一ポリシーで歩行可能というスケーラビリティが実証されました。

Figure社はこの成果を「ロボットの人間的動作の第一歩」と位置付け、将来的には数千体規模での運用を視野に入れています。同社は今後、さらなる日常動作や人間的なタスクにも対応可能な汎用ポリシーの開発を進める計画です。

  • URLをコピーしました!