arXivのプレプリントとして公開された、視覚言語ナビゲーション(VLN-CE)向けの研究です。 / LLMを基盤にした生成エージェント「Cog-GA」を提案し、認知地図、次の移動先予測、振り返り機構を組み合わせる方法が示されています。 / abstractでは、環境の手がかりを「what」「where」に分けた説明を使う点や、継続的な学習・再計画を支える仕組みが述べられています。