arXiv上のプレプリントとして公開された、ScienceQA向けの論文です。 / 高品質な人手注釈のCoT(chain-of-thought)理由付けを集める負担に着目し、LLMのシグナルを使って学習用の教示データを作る手法が提案されています。 / 小さめのモデルに複雑なマルチモーダル推論を学習させることを目指しており、データ混合の戦略も含まれています。