2024年2月 - 先端技術社会科学研究所

論文紹介: 強化学習と大規模言語モデルの関係を整理する分類体系の提案

2024年2月2日

arXivに掲載されたプレプリントで、強化学習（RL）と大規模言語モデル（LLM）の組み合わせ研究を整理する論文です。 / 著者らは、RLとLLMの関係を3つの主要クラスに分ける分類体系を提案しています。 / LLMの性能改善にRLを使う「RL4LLM」、RL学習をLLMが支援する「LLM4RL」、両者を共通の計画枠組みに置く「RL+LLM」に整理しています。