Echo-Memory: A Controlled Study of Memory in Action World Models
この研究では、エピソード記憶を制御するために、エピソード記憶モデルを設計および評価しました。エピソード記憶モデルは、エピソード内の重要な情報を記憶し、エピソード間の相関関係を特定することができます。
- 用途
- エピソード記憶
- 難易度
- Hard
- コスト
- High
「retrieval」の検索結果
65 件この研究では、エピソード記憶を制御するために、エピソード記憶モデルを設計および評価しました。エピソード記憶モデルは、エピソード内の重要な情報を記憶し、エピソード間の相関関係を特定することができます。
この研究では、拒否学習における検索
バイオメディカル言語モデルの場合も、Cosine Similarityで2つのトピックを関連付ける際に、0.83をスコアに返却しますが、実際にはその2つは関係がありません。このことから、off-the-shelfのバイオ
ラングラージュモデルを解釈するためのアクティベーション分析を提案。モデルを分析することで、モデルがどのようなコードを生成しているかを理解する。
この研究では、ゼロショット セマンティック再特定の基準を設定し、画像のセマンティック特定を自動化します。
この研究では、テキスト、画像、ビデオ、アウディオ等の異なるモダリティのデータを統合したオムニモダル検索システムを構築します。
Retrieval algorithms are used to estimate atmospheric concentrations of greenhouse gases (GHGs), such as carbo
This paper presents a unified system designed to support precision agriculture by integrating advanced weather
Video retrieval at scale is central to data curation and safety validation in autonomous driving, where users
LLM推論において、長いコンテキストを扱うことが多く、GPUメモリボトルネックの問題が起きます。この課題に対処するために、Neural Memory Indexerと呼ばれる Neural Memory Indexerを
知識グラフの補完の評価の多様な評価方法を実現するために、新しいアプローチを提案します。
この論文では、シミュレータの設定を改善するために、新しいフレームワークを提案する。これにより、シミュレーターをより効率的に設定できる。
この論文では、法令上の異議申し立てを検出し、法令上の違反を最小限に抑える方法を提案する。
Can a general-purpose large language model design molecules with the precision of a seasoned chemist? Current
LLMエージェントの長期記憶の改善の為に、DCPMと呼ばれる新しい記憶システムが提案され、エージェントの能力が向上する。
RAGプレフィルへの速力向上を目的としたSIFTが提案され、TTFTを短縮し、コストを削減する。
Medical agent systems are increasingly expected to support interactive clinical decision making rather than on
代理機器が外部の知識を活用して、多くのタスクを効率的に解決できる「Anything2Skill」を提案している。
Social Scienceにおける、Memory-Augmented Social Simulationを利用した深層学習を利用して、新しい研究方法を提案し、Social Scienceの研究実現を実現した
科学的アイデア生成には、現実に実現可能な高質のアイデアを必要とするが、この課題を解く方法は不足していたため、新しい方法であるGraph2Ideaを提案。
Large Language Models (LLMs) have enabled increasingly personalized interactions by adapting to users' prefere
Interior permanent magnet synchronous motor (IPMSM) design requires balancing conflicting objectives and multi
連続的な治療に適した臨床級LLM医系であるBaichuan-M4を導入。臨床的な医療エージェントシステムであるBaichuan-M4は、統合的な医療エージェントシステムをベースとし、医療エージェントと医療エージェントの連
This report summarizes the CHIIR 2026 Workshop on Generative AI and Academic Search (GAI\&AS), which examined
Spinal pathology is a leading cause of pain and disability worldwide. Spine MRI is central to clinical evaluat
Court simulation bridges legal education and judicial practice, yet human-based simulations are costly and dif
この研究では、検索タスクにおける抽象レベルにおけるギャップを解消するためのフレームワークであるAbstRAGを提案し、検索タスクにおけるギャップを解消したことで、モデルが検索タスクにおいて正しく情報を開示した。
Creativity is a complex cognitive ability that relies on knowledge organisation and retrieval from semantic me
The emergence of reasoning multimodal large language models (MLLMs), which generate explicit chain-of-thought
Retrieval-augmented generation (RAG) systems often serialize user queries, retrieved documents, metadata, syst
We introduce ChinaHeritaQA, a multimodal benchmark dataset for evaluating the cultural reasoning abilities of
Text-driven indoor scene generation and editing require an intermediate representation that language models ca
The state-of-the-art generative models, such as CycleGAN, Pix2Pix, and diffusion models have demonstrated rema
The dominant paradigm in video retrieval relies on embedding-based full-corpus scanning, which suffers from in
Worldwide image geo-localization aims to determine the capture location of an image on a global scale. Existin
Learning robot manipulation policies with deep neural networks from a single demonstration remains highly chal
We present RPO-PDT: a retrieval-grounded, role-play-based dialogue system for adaptive student support in high
We present a voice conversion (VC) framework that utilizes K-Nearest Neighbors (KNN) retrieval over WavLM repr
Linear attention reformulates sequence modeling as recurrent state evolution, enabling efficient linear-time i
Agent skills extend language-model agents with task-specific procedures, scripts, and references, but the task
Prefill-decode (PD) disaggregation decouples prompt processing from token generation, but it also turns the ke
Large language models frequently fail in a characteristic way: rather than acknowledging ignorance, they produ
While global data-driven models excel at predicting continuous atmospheric variables, three-dimensional hydrom
Skill-augmented reinforcement learning improves language agents by storing reusable procedural knowledge acqui
To interpret context correctly and retrieve relevant information, large language models must bind entities to
We present a multilingual fact-checking system deployed at Factiverse, designed for high-throughput and low-la
Large language models answer knowledge-intensive questions using both parametric memory and retrieved evidence
To perform a wide range of daily tasks, robots need to construct a 3D representation that is semantically rich
The task of temporal answer grounding in instructional video (TAGV), which aims to locate precise video segmen
Multi-contrast brain MRI provide complementary soft-tissue characteristics that aid in the screening and diagn
AgriGov is a curated, trilingual (English-Hindi-Marathi) dataset designed to address the scarcity of domain-gr
Large language models (LLMs) are increasingly used in academic research workflows, but scholarly tasks require
This paper presents our system description for the 2nd Workshop on Multimodal Augmented Generation via Multimo
Modern large language model (LLM) agents can use external tools to help users solve complex tasks. However, fo
Long-horizon robot operation requires spatio-temporal memory to record the environment state and recall it for
Composed Video Retrieval (CVR) is designed to retrieve a target video that matches a reference video modified
この論文では、embodied agentsが未来の行動を予測するためのnew Contrastive Action-conditioned Parallel Encoding(CAPE)フレームワークを提案した。CAP
この研究では、近似近似近似的ノンリニアリスの学習 (Approximate Nearest Neighbour Search) を提案しており、近似近似近似的ノンリニアリスを効率的に学習する。
この研究では、値または期待短期的なリスク管理 (Value-at-Risk and Expected Shortfall) を提案しており、短期的なリスクを効率的に管理する。
Cooperative Multi-Agent Reinforcement Learning (MARL) frequently suffers from severe reward sparsity and explo
Online evaluation of ranking and retrieval systems often relies on downstream monetization metrics such as app
Accurate modeling of leaf spectral reflectance from physiological and biochemical traits is essential for adva
We introduce the Preisach Attention Layer (PAL), a novel sequence modelling architecture grounded in the class
Generating high-performance GPU kernels remains challenging due to the need for both correctness and hardware-
high-capacity associative memory modelsは強力な記憶力を持っていますが、通常、計算的によく遅い同期更新を必要とします。この研究では、asynchroneous retrieval d