論文紹介: 不可能性結果をAIシステム設計の指針として扱う試み
arXivに、新着のプレプリントとして、AIシステムの「不可能性結果」を設計上のルールとして捉え直す論文が公開されています。 / 要旨では、LLMがソフトウェア生成や法務文書、臨床ノート作成に使われる一方で、計算の限界を示す理論が設計に影響すると説明されています。 / 著者は、ある種の推論深さを超えると、学習条件を変えても精度の上限が動かないとする結果を主張しています。
論文紹介: プロンプトベース学習を体系化したNLPレビュー論文
自然言語処理における「prompt-based learning」を整理し、関連研究を体系的にまとめたレビュー論文です。 / 従来の教師あり学習と異なり、言語モデルに対してテンプレート化した入力を与え、空欄を埋める形で予測に使う考え方が説明されています。 / 掲載誌は ACM Computing Surveys で、公開情報では高被引用の論文として扱われています。
論文紹介: 大規模言語モデルを用いた衛星ネットワーク向け生成AIエージェントとMoEによる送信戦略
IEEE Journal on Selected Areas in Communications 掲載の論文として扱える一次情報です。 / 衛星通信ネットワークのモデル化の難しさと、衛星とユーザー間の干渉による性能低下が課題として挙げられています。 / 論文では、モデル構築のための生成AIエージェントと、Mixture of Experts(MoE)を組み合わせて送信戦略を設計する方法が提案されています。
論文紹介: Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG
Semantic Scholar上で高被引用候補として収集された、RAGの発展形である「Agentic RAG」に関するサーベイ論文です。 / LLMの静的な学習データだけでは、最新情報や動的な問い合わせに弱いという課題に対し、検索を組み合わせるRAGの流れを整理しています。 / 本文抜粋からは、従来のRAGが固定的なワークフローに縛られやすい点を踏まえ、より適応的な仕組みとしてエージェント的なRAGを論じる内容だと読み取れます。
論文紹介: 深層学習の概念、CNNアーキテクチャ、課題、応用、今後の方向性を整理したレビュー論文
2021年にJournal of Big Dataで公開された、深層学習のレビュー論文です。 / OpenAlexの収集情報では被引用数が7,424件で、引用上位の論文候補として扱われています。 / abstractでは、深層学習が機械学習分野で広く使われ、複雑な認知タスクで高い成果を示してきたこと、また大量データを学習できる点が強みとして述べられています。
論文紹介: 自己最適化する長期学習エージェント「SOLAR」に関する新着プレプリント
arXivに、LLMの継続学習と環境変化への適応を扱う新着プレプリントが掲載されています。 / 論文要旨では、動的な実世界環境での概念ドリフトと、勾配ベースの適応コストの高さが課題だと説明されています。 / 提案手法は Self-Optimizing Lifelong Autonomous Reasoner(SOLAR)で、ストリーミングデータや継続学習の枠組みでの利用を想定していると読めます。
論文紹介: 大規模言語モデルの強化学習におけるクレジット割り当てを整理するサーベイ
大規模言語モデル(LLM)の強化学習で、結果だけではなく途中のどの行動が成果に効いたのかを考える「クレジット割り当て(CA)」の問題を扱う論文です。 / 要旨によると、推論向けRLとエージェント向けRLの2つの場面を整理し、47本の手法を2次元の分類でまとめています。 / 論文では、機械可読の文献インベントリ、今後の論文向けチェックリスト、ベンチマーク手順の仕様という再利用しやすい資源も提案されています。
論文紹介: 強化学習と大規模言語モデルを組み合わせたロボット操作フレームワーク
arXivのプレプリントとして、強化学習(RL)と大規模言語モデル(LLM)を組み合わせたロボット操作向けの新しいハイブリッド手法が報告されています。 / 低レベルの制御をRL、高レベルの計画や自然言語理解をLLMが担う設計で、ロボットの実行と推論をつなぐことを狙っています。 / PyBullet上のシミュレーションとFranka Emika Pandaアームを使った評価で、RLのみの方式と比べてタスク完了時間の短縮、精度と適応性の向上が示されたとされています。
論文紹介: DLLM-Searcher: Diffusion Large Language Modelを検索エージェントに適応する試み
arXivのプレプリントとして公開された、検索エージェント向けのdLLM活用に関する論文です。 / 要旨では、dLLMの並列的な生成特性を、ReAct型エージェントの遅延削減に生かす狙いが説明されています。 / 一方で、既存のdLLMは推論やツール呼び出しの能力が弱く、実運用で十分に使うには追加学習が必要だとされています。
論文紹介: 依存構造を手がかりにした説明可能なマルチモーダル感情分析
テキストと画像を組み合わせるマルチモーダルな aspect-based sentiment analysis(MABSA)を扱う論文です。 / 従来の分類中心の手法に対し、感情判定と自然言語による説明生成を同時に行う枠組みを提案しています。 / 依存構造木を手がかりにした cue strategy により、aspect ごとの推論を助けると説明されています。
