2023年11月 - 先端技術社会科学研究所

2023年11月4日

ロボット操作の強化学習に、LLMの自然言語フィードバックを組み合わせる枠組みを提案しています。 / 人手の専門家による監督が難しい場面で、LLMを自動的な助言役として使う発想が示されています。 / RLBenchのタスクで、学習効率と成功率がベースラインより改善したと報告されています。