AI関連ニュース
論文紹介: Cog-GA — 連続環境の視覚言語ナビゲーション向け生成エージェント

arXivのプレプリントとして公開された、視覚言語ナビゲーション(VLN-CE)向けの研究です。 / LLMを基盤にした生成エージェント「Cog-GA」を提案し、認知地図、次の移動先予測、振り返り機構を組み合わせる方法が示されています。 / abstractでは、環境の手がかりを「what」「where」に分けた説明を使う点や、継続的な学習・再計画を支える仕組みが述べられています。

続きを読む