An Agency-Transferring Model-Free Policy Enhancement Technique
助け手モデルは、タスクの成果を最大化するために設計されていますが、実際には不適切または不完全な助け手モデルを使用している場合があります。この論文では、元の助け手モデルをRLのトレーニングプロセスに組み込むことで、トレーニ
- 用途
- 助け手モデル改良
- 難易度
- Hard
- コスト
- High
「embedding」の検索結果
87 件助け手モデルは、タスクの成果を最大化するために設計されていますが、実際には不適切または不完全な助け手モデルを使用している場合があります。この論文では、元の助け手モデルをRLのトレーニングプロセスに組み込むことで、トレーニ
バイオメディカル言語モデルの場合も、Cosine Similarityで2つのトピックを関連付ける際に、0.83をスコアに返却しますが、実際にはその2つは関係がありません。このことから、off-the-shelfのバイオ
Long-context language model inference is bottlenecked by memory, as the KV cache grows with context length. Re
We study whether pretrained video foundation models encode intuitive-physics information in their frozen repre
scRNA-seq データの解釈を向上させる Transformer を提案。モデルにゲノム規制的情報を組み込むことで、遺伝子発現の解釈と予測の精度が向上することを示した。
結合作用を考慮した分子力の予測を研究。モデルの推論を効率化するために、モデルのスケールを自動的に調整する方法を提案した。
この研究では、ゼロショット セマンティック再特定の基準を設定し、画像のセマンティック特定を自動化します。
この研究では、テキスト、画像、ビデオ、アウディオ等の異なるモダリティのデータを統合したオムニモダル検索システムを構築します。
Football event data constitute a rich spatiotemporal source for quantitative analysis of player actions in tea
Understanding how transformer representations evolve across layers, not merely what they encode, remains an op
パーキンソン病(PD)の早期検出への取り組みとして、脳の損傷が発症前に生じる話術障害を分析するため、音声分析を用いてパーキンソン病の診断を提唱しています。
Alcmean's アルゴリズムは、複雑なネットワークの分析において基本的な問題であるコミュニティ検出に取り組んでいます。従来のアルゴリズムはマニュアルなパラメータ調整を必要としており、中心の選択も不正確です。この課題を
In science and engineering, Lagrangian simulation methods such as Smooth Particle Hydrodynamics (SPH) or Mater
ADMMを使用した凸最大化を高速化するために、入力非線形ニューラルネットワークを使用して目的関数のモアユーブンフォルーの近似を作成する学習アジュスト化システムであるLEAFを提案します。
モジュラー演算を使用することで、メモリを最適に利用することができるようになり、パフォーマンスの向上につながります。
時系列データの異常の検出におけるアンプリットードの保存は、パフォーマンスを向上させるために不可欠です。
この論文では、Transformer を使用してタスク認識の弱さを検出し、検出精度を向上させる方法を提案する。
この論文では、コードクオリティを評価し、エラーの発生率を減らすために、Fast Adaptive Semantic Entropy (FASE) を提出する。
基礎モデルは、多モーダル生理信号を人間の健康に縮小された表現に圧縮することで、睡眠医学、心臓学、神経学など、広い応用域への道を開いています。既存のモデルは、一般的にはマスクした再構築または対比的目的で訓練されています。
Two-server secure inference allows a client to query a hosted large language model (LLM) without revealing pro
可勉強のターブルの信号に関する表現モデルが、異なるトレーニングパラダイムを持つモデルを評価しやすくする基準であるTRL-Benchを提案している。
世界モデルを使用して、潜在的ステートを利用して長期的な計画を行えるFF-JEPAを提案している。
EEG foundation-model releases are usually audited one endpoint at a time: raw-reconstruction, membership infer
3次元シミュレーションシーンから知識グラフを構築することが、ロボットのタスク推論に重要な役割を果たすが、シーンのオブジェクトを形式的な分類にマッピングするステップが、現実に現れていない。LLMを使用して、このマッピングの
Spinal pathology is a leading cause of pain and disability worldwide. Spine MRI is central to clinical evaluat
Large language models (LLMs) provide a powerful reasoning backbone for speech understanding, but integrating c
Social highlighters let people mark passages that matter to them. We ask how much of an individual is recovera
Embodied world models have emerged as a pivotal paradigm for visual robotic decision-making and interactive en
The dominant paradigm in video retrieval relies on embedding-based full-corpus scanning, which suffers from in
In real-world deployment under strict real-time constraints, weather and imaging variations induce significant
In this paper, we present XInsight Lab's solution to the micro-gesture classification track of the 4th MiGA Ch
Hyperspectral object tracking (HOT) leverages the rich spectral information provided by hyperspectral videos (
Glaucoma is a leading cause of irreversible blindness worldwide, and early detection from fundus images is cri
Worldwide image geo-localization aims to determine the capture location of an image on a global scale. Existin
Force and tactile sensing are indispensable in contact-rich manipulation. However, force-aware robot learning
Gaussian-corrupted sentence embeddings have no direct linguistic interpretation, yet continuous diffusion lang
Modern neural classifiers commonly rely on linear readouts, yet predictive metrics alone do not characterize t
Sophisticated generative speech technology can undermined the reliability of voice biometrics. While spoofing
Global wind power capacity, especially in China, is booming, with new farms spanning diverse terrains and clim
Unmanned aerial vehicles (UAVs) are increasingly being deployed in logistics, service robotics, and other real
We present HydraQE, our contribution to the IWSLT 2026 Speech Translation Metrics shared task. HydraQE is an e
Symbolic music evaluation for large language models remains fragmented across representations, datasets, and m
We present a multilingual fact-checking system deployed at Factiverse, designed for high-throughput and low-la
Transformer language models process input provided as subword fragments, but natural language semantics usuall
Fisheye cameras are widely deployed in autonomous driving perception suites for their low cost and full-covera
The rapid advancement of generative models has blurred the boundary between synthetic and real imagery, creati
Vision-language models (VLMs) pretrained on large-scale image-text pairs demonstrate strong image-level unders
Modern language models represent text using discrete token-level embeddings, which forces recurring multi-toke
As large language models are increasingly deployed in high-stakes settings, there is a growing need for tools
Large language models (LLMs) frequently generate hallucinations, which are unsupported by a source document. T
Infrared and visible image fusion aims to generate a composite image that retains significant target informati
Debiasing methods based on principal component analysis (PCA) are broadly used to reduce gender bias in word e
Self-supervised learning (SSL) has achieved remarkable representation learning performance, but many existing
Recent advances in Diffusion Transformers have driven rapid progress in video generation and editing, yet thes
World Action Models (WAMs) extend robot policy learning by incorporating future prediction as an additional tr
Neural fields parameterize data as functions from coordinates to values, providing a unified framework for rep
MRI preprocessing defines the input distribution seen by brain MRI foundation models, yet it is usually treate
We present OSMGraphCLIP, a CLIP-style geospatial representation model that learns global location embeddings f
Soft-bodied organisms such as octopuses and elephant trunks exhibit remarkable morphological adaptability, dyn
この研究では、強い攻撃に対してグラフニューラルネットワーク (GNN) の安定した推論を保つために、PAC-ベイズ分析を使用して GNN の一般性を分析します。新しい分析方法を提案することで、GNN の弱信頼性の推論結果
この研究では、複数のドメインの複雑なデータを分析するために、Bayesian モデルを使用して因果関係を分析するツールを開発します。主に社会調査に使用できるツールです。
この研究では、複数ドメインのデータを扱うための主成分分析 (PCA) を改善する方法を提案します。この方法は「Anchor PCA」と呼ばれ、複数ドメインのデータを扱うための次元削減を実行できます。
Open-vocabulary 3D functionality segmentation enables robots to localize functional object components in 3D sc
この研究では、シニティックなシナリオを用いたロボットの安全性ポリシーの学習を提案します。Red TeamとBlue Teamは、プログラミング言語のガミフィケーションフレームワークを用いて、シナリオ生成をアドバレッシアル
この論文では、複数環境で動作するモデルの構築に取り組み、環境がラテント変数の分布を変化させることを仮定しました。
この研究では、非線形不等式制約の学習 (Nonlinear Inequality Constraints) を提案しており、非線形不等式制約を効率的に学習する。
この研究では、近似近似近似的ノンリニアリスの学習 (Approximate Nearest Neighbour Search) を提案しており、近似近似近似的ノンリニアリスを効率的に学習する。
Diffusion models have demonstrated strong performance in time series modeling due to their ability to progress
Selecting a clustering algorithm and its hyperparameters without labels is a common difficulty in engineering
We study a distributional generalization of the matrix completion problem in which each entry of the target ma
時系列データの分類と新しいクラスを追加しやすいクラス増加モデルの開発と、それを用いた実験結果について論じます。
Many machine learning problems, including similarity learning, ranking, and clustering, rely on empirical pair
Pre-training has become a fundamental paradigm in modern machine learning, with one of its key empirical benef
Semi-supervised hierarchical clustering aims to learn a tree structure consistent with data patterns and user-
Traditional bilateral negotiation support systems search over discrete allocation spaces. This approach encoun
Network data are ubiquitous across the social sciences, biology, and information systems. Generating realistic
Large language models are increasingly deployed as advisors whose objective is not aligned with the user's: re
In RLHF, each training example contains a prompt $x$ and two candidate responses $y,y'$, and annotators provid
本論文では、機械学習と物理法則を組み合わせたPhysics-Informed Machine Learning (PIML)を電力システム予測に適用した。PIMLは、機械学習と物理法則を組み合わせて、高精度で正確な予測を
Von Economo neurons (VENs) are selectively lost in behavioural-variant frontotemporal dementia (bvFTD) and red
これは、パフォーマンスの高いモデルサイズの減少を実現するために、Perforated Neural Networkがキーワード検出タスクに適用されていることを検証したり、Edge Impulseで動作するキーワード検出シ
ゲームの抽象化を実現する方法を提案した研究は、ゲームを大きくする要因を削減するために役立つ。しかし従来の方法は、別のゲームに応用する際にゲームごとに分析する必要がある。これは、抽象化を一般化するの難しい原因の1つとなる。
EEGモデルをメカニズム的理解を通して解釈することを目標とした方法を提案し、EEGデータの分析を可能にしながらモデルの中間表現を解釈することを目指した。
多分類パラメーターを扱うためのタイプ-実現した共進化の方法を提案し、この方法が実
Solve the Loopは、屈折トランフォーマーの改善に役立つアルゴリズムを紹介する研究である。
We decompose an evolutionary mixture-of-LoRA system on a from-scratch ~150M-parameter widened-D substrate (D=1
Large Language Models exhibit mode collapse, producing homogeneous outputs that fail to explore valid solution