研究 / Research
情報学プリンシプル研究系
研究紹介
人工知能で学習するロボットの運動制御研究
SF作品を見てきた影響か、昔からヒューマノイドロボットなどへの憧れがあり、ロボット研究の道に進みました。今はいろいろなロボットが開発されていますが、ロボットに二足歩行をさせることも、実はかなり難しく、自律的に歩き続けるようなロボットはまだ実現されていません。一方で、見方を変えて、「目的を達成すること」に主眼をおけば、無理に二足歩行にこだわることはありません。私たちも、山を登るときに倒れそうになったら、手をついたりして体を支えます。ロボットもそういうことができるようになれば、もっとうまく目的を達成できるのではないか。そのような発想で研究をしています。
機械学習を活用した次世代の自律ロボット
機械学習の中でも「強化学習」と「模倣学習」を中心に研究をしています。
強化学習は、ロボットが自ら試行錯誤を繰り返して学習していくというものです。基本的に、強化学習は、実際の状況を観測し、その情報をもとに制御される「フィードバック制御」で学習していきます。しかし、私たち人間は、フィードバック制御だけで動いているわけではありません。たとえば、ブラインドタッチをするとき、キーボードを見ないでも、すらすらとキーを打つことができます。このように、実際の状況を観測することなく、予測しながら制御することを「フィードフォワード制御」といいます。私はフィードバック制御だけでなくフィードフォワード制御も一緒に学習できるような強化学習技術を開発し、実際の状況が把握できなくなったときでも、ロボットが予測して次の動作を判断できるような仕組みをつくりました。この技術は、配管の検査などで需要がある蛇型ロボットの移動制御などに応用しています。
模倣学習は、名前の通り、真似して学習するというものです。模倣学習では、良いお手本のデータセットをたくさん用意することが重要なのですが、実際は、ちょっとしたミスやうまくない動きのデータも含まれてしまいます。そこで、うまくない動きのデータは除外して、上手な動きだけを学習するような模倣学習技術をつくっています。この技術は、他大学との共同研究で、胚培養士(主に不妊治療において受精卵を扱う専門家)の操作支援を行うロボットへの応用などに活用しています。
「世界モデル」の導入。そして「ロボット知能」という新提案
NIIでは上記の研究を続けつつ、運動制御の前段階のテーマとして「世界モデル」の研究にも取り組んでいます。現実世界は、見えるものだけでも情報が膨大です。そうした膨大なデータを使ってロボットに学習させるのは、効率がよくありません。そこで、現実世界を必要最低限の抽象化された世界として捉えようというのが「世界モデル」です。世界モデル上であれば、ロボットを歩かせるときに、でこぼこした道でも、最低限の本質的な情報のみを捉えることで、「ここは平地と見なして大丈夫」と大まかに判断できるので、学習がより簡単になります。
もう一つ、取り組みたいと思っているのは、「ロボット知能」というものです。この言葉は私が考えました。「知能ロボット」という言葉はよく聞くと思います。知能ロボットは、機械学習などの既存技術をロボットに搭載した、知能をもった賢いロボット、という意味で使われます。しかし、ロボットを動かすための理論研究をしていると、ロボットだからこそ起こる問題があり、既存技術ではうまくいかないことがあるのです。そこで、ロボットのための知能=ロボット知能とはどういうものか、というこれまでとは逆のアプローチが必要だと感じています。「ロボットだったらこういう問題設定で解かなくてはいけない」とか「ロボットだとデータにこういう偏りが出る」といったことをクリアにして、ロボットに特化した機械学習技術を理論的に体系化できたらと考えています。