MLinfo | 機械学習・AI論文まとめ

「qa」の検索結果

7 件

この研究では、遥宙イメージングモデルの特化を支援するための能力ギャップドリブン訓練法を提案し、遥宙イメージングモデルの特化において、従来のfine-tuning法に比べて性能が向上することを示しました。

多モードチェーンオブサウンドの推論には、視覚的およびテキスト的 cueをステップアップの推論で統合することが含まれます。しかし、小型のモデルでは、モダリティ間の融合は小さなcross-modalの違いに抑圧されます。

長形推論のための言語モデルが、提供されたコンテキストから乖離した論理を生成する可能性があることを指摘し、コンテキストと推論論理をより適切に融合するため、 REFACT (REstating Facts in Adapti

この研究では、大規模言語モデルをK-12教育の評価と向上に使用するための基準を提案した。主な問題は、教育の文脈における文脈理解（curriculum cognition）の欠如である。この研究では、指定された教科書から提

ReferTrack は、自然言語で対象の車両に付近する自動車を追従させるシステムである。このシステムでは、対象の車両に付近する自動車を認識する後、自動車の動きを予測する。

金融データを扱う上で、多くのエージェントが異なる回答を示す問題を解決するために、金融-LaTeX SKILLを開発し、2,000個の専門知識を網羅した財務文書を作成する。

Video spatial reasoning is essential for navigation-oriented perception and long-video question answering, whe