論文紹介: 大規模言語モデルのアーキテクチャ、ベンチマーク、課題を整理したサーベイ
arXivのプレプリントとして、大規模言語モデル(LLM)とマルチモーダル大規模言語モデル(MLLM)の最近の動向を整理したサーベイ論文です。 / Abstractでは、LLMの進化、MLLMの登場、代表的モデルの比較、技術的特徴、強みと限界、今後の課題が扱われています。 / テキスト生成、翻訳、質問応答、コード生成・解析に加え、画像・音声・動画など複数モダリティを扱う方向性がまとめられています。
論文紹介: LLMでMinecraftの建築計画を立てる「APT」— ブループリント生成と実行を組み合わせたエージェント研究
arXivのプレプリントとして、LLMを使ってMinecraft内の複雑な建築を計画・生成する枠組み「APT」が提案されています。 / ポイントは、画像生成モデルで直接ボクセルを作るのではなく、LLMの空間推論や段階的な分解を使ってブループリントを作る設計です。 / zero-shot / few-shotでの実行、memory・reflectionによる反復 सुधार、複数の構成要素からなるベンチマーク評価が含まれています。
論文紹介: テキストとグラフを組み合わせる分子逆設計モデル「Llamole」
arXivのプレプリントとして、分子設計と逆合成計画に向けた多モーダルLLM「Llamole」を提案する論文です。 / 画像ではなくグラフを扱うLLMの難しさに対して、テキストとグラフを交互に生成できる仕組みを示しています。 / Graph Diffusion TransformerやGraph Neural Networks、A*探索を組み合わせ、分子生成と反応推論を行う点が特徴です。
論文紹介: Cog-GA — 連続環境の視覚言語ナビゲーション向け生成エージェント
arXivのプレプリントとして公開された、視覚言語ナビゲーション(VLN-CE)向けの研究です。 / LLMを基盤にした生成エージェント「Cog-GA」を提案し、認知地図、次の移動先予測、振り返り機構を組み合わせる方法が示されています。 / abstractでは、環境の手がかりを「what」「where」に分けた説明を使う点や、継続的な学習・再計画を支える仕組みが述べられています。
論文紹介: 大規模言語モデルの知識を積み上げてGNN設計を支援する「DesiGNN」
arXivのプレプリントとして公開された、Graph Neural Network(GNN)設計支援に関する論文です。 / LLMは一般的な推論は得意でも、グラフの性質に応じたGNN設計のような専門性の高い作業では難しさがある、と論文では説明されています。 / 提案手法DesiGNNは、過去の設計経験を知識として整理し、LLMに適した形で活用する枠組みとされています。
論文紹介: 少数ラベル環境でGNNを強化するためにLLMから知識を積極的に蒸留する手法
arXivのプレプリントとして公開された、グラフニューラルネットワーク(GNN)と大規模言語モデル(LLM)を組み合わせる研究です。 / 少数のラベルしかないノード分類で、LLMのゼロショット推論や推論能力を活かしてGNNの性能向上を狙っています。 / 著者らはGraph-LLMベースのactive learningパラダイムを提案し、限られたラベルデータでの精度改善を報告しています。
論文紹介: LatentExplainer — 深層生成モデルの潜在表現をMLLMで説明する手法
深層生成モデルの潜在変数を、意味のある説明文として自動生成する枠組みを提案しています。 / 潜在変数の意味推定、説明とモデルの帰納バイアスの整合、説明可能性の度合いの違いへの対応が主な課題として挙げられています。 / 潜在変数を摂動し、生成結果の変化を見ながら、マルチモーダル大規模言語モデルで説明を作る方法が示されています。
論文紹介: GNN-RAG: Graph Neural Retrieval for Large Language Model Reasoning
知識グラフ上の質問応答(KGQA)において、GNNとLLMを組み合わせるRAG型の手法が提案されています。 / GNNで密な部分グラフを推論して候補を取り出し、その経路を自然言語化してLLMに渡す構成だと説明されています。 / 追加のretrieval augmentationにより、KGQA性能をさらに高める工夫も示されています。
論文紹介: 宇宙探査向けの大規模言語モデルベース自律エージェント「LLMSat」
arXivのプレプリントとして、宇宙機の高い自律性を目指すLLMベースの制御システム「LLMSat」が紹介されています。 / 論文は、宇宙機の高レベル制御に大規模言語モデルを使う設計を、システム工学の観点から検討したものです。 / 著者は、Kerbal Space Programのシミュレーション環境で複数の深宇宙ミッション場面を試し、こうしたアーキテクチャの有用性を評価しようとしています。
論文紹介: 大規模言語モデルをグラフマイニングに適用する「MuseGraph」— 複数タスクを一つのモデルで扱う試み
arXivのプレプリントで、カテゴリはcs.CLとcs.AIです。 / LLMとGNNの強みを組み合わせ、複数のグラフタスクとデータセットにまたがる基盤モデルを目指す枠組みが提案されています。 / コンパクトなグラフ記述、Chain-of-Thoughtベースの指示生成、グラフを意識したinstruction tuningが主な工夫として説明されています。
