2024年9月 - 先端技術社会科学研究所

論文紹介: Cog-GA — 連続環境の視覚言語ナビゲーション向け生成エージェント

2024年9月4日

arXivのプレプリントとして公開された、視覚言語ナビゲーション（VLN-CE）向けの研究です。 / LLMを基盤にした生成エージェント「Cog-GA」を提案し、認知地図、次の移動先予測、振り返り機構を組み合わせる方法が示されています。 / abstractでは、環境の手がかりを「what」「where」に分けた説明を使う点や、継続的な学習・再計画を支える仕組みが述べられています。