Discovering Functionally Selective Brain Regions with a Deep Topographic Multimodal Model
この研究では、脳部帯域内のニューロンが同じ反応プロファイルを持つと仮定し、近接な脳部帯域内のニューロンの反応プロファイルを推論し、分野間の結合を特定しました。
- 用途
- 脳部帯域の研究
- 難易度
- Hard
- コスト
- High
「Fine-tuning」の検索結果
109 件この研究では、脳部帯域内のニューロンが同じ反応プロファイルを持つと仮定し、近接な脳部帯域内のニューロンの反応プロファイルを推論し、分野間の結合を特定しました。
この研究では、低リソース言語NMTのために、データ合成方法を開発しました。これにより、データ合成されたコーパスを使用し、NMTモデルをパラメータ効率的にフィーヌチュン化できます。
Contextual queueing bandits provide a framework for learning to schedule heterogeneous jobs under unknown cont
Muon has recently emerged as a state-of-the-art optimizer for pretraining Large Language Models (LLMs) and vis
動画大規模言語モデルを使用した質問に対する回答を研究。モデルの能力と限界を調査し、質問に対する答えを生成するための方法を提案した。
On-Policy Distillation (OPD) has become a core technique in the post-training of Large Language Models (LLMs)
この研究では、機械学習モデルをプライバシー保護のための適応化する際、プライバシー保護の実験的な効果を分析することに関与します。
この研究では、プレトレーニング済みモデルを低レベルタスクに向けて適応化するためのPrior-Support ガイドされた超視覚的フィニートゥニング方法であるPriFT を提案しました。
この研究では、強力な防御ガードモデルと低パラメータのLLMを組み合わせたデュアルモデルシステムを導入し、安全なLLMのデプロイに使用できます。
この研究では、テキスト、画像、ビデオ、アウディオ等の異なるモダリティのデータを統合したオムニモダル検索システムを構築します。
この論文では、data mining におけるビジュアルプログラミングフレームワーク、Orange Lab を提唱しました。これにより、Webベースのデータ分析環境を提供し、ユーザーフェイシングの分析ツールとしてデータ分
理論的思考は、最新の基礎モデルシステムが安全かつ効果的に現実世界で動作するには必須のスキルであると考えられています。しかし、理論的思考の進進には、「ショートカット」問題が存在し、タスクは99%の正解率を達成するのに、ただ
Process Reward Models (PRMs)は、セグメントごとにフィードバックを提供し、credit assignmentを改善します。しかし、我々はPRMsにおける偏微分に関する潜在的な偏りを識別し、この偏
Two-stage post-training -- a Stage-1 warm-start (supervised fine-tuning, SFT, or on-policy distillation, OPD)
A classical universal stabilization formula offers the practitioner no design freedom: it is a single, paramet
知識グラフの補完の評価を実現するために、新しいアプローチを提案します。
この論文では、エージェントの委譲能力を改善するために、新しいフレームワークを提案する。これにより、エージェントがより効率的にタスクを分割できる。
Recursive self-design refers to AI-assisted modification of the mechanisms by which an AI system is built, eva
During instruction fine-tuning (IFT), large language models (LLMs) learn to follow instructions by using the p
スピーチアセスメントを自動化するためのSpeechLLMが提案され、スピーチの質と能力を評価する。
Webエージェントを自動化するためのAliyunConsoleAgentが提案され、ドキュメントの検証とWebエージェントの開発を簡素化する。
可変化の帯域幅を考慮した、聴覚超材料の逆設計における新しいフレームワークである Physics-Guided Sequence-Based Generative Framework for Acoustic Metama
少ない例の問題のオブジェクト認識においては、オブジェクト認識の提案の精度を向上させることができる。
Egocentric visionを使用して、ペダストリアンの歩く道に渡るのを予測する。Closed-ended visual question answering(VQA)問題に形式することで、ビジョン言語モデルを使用
Large Language Models (LLMs) have enabled increasingly personalized interactions by adapting to users' prefere
Comprehensive estimation of dietary micronutrients from food images could improve clinical nutrition care, but
Semiconductor lithography inspection requires reliable detection of small pattern defects such as bridge, burr
この研究では、音楽生成における多様性を促進するためのオープンソース・フレームワークを開発します。このフレームワークは、音楽生成における多様性の促進を支援するために、進化的プロセスと多様性促進アルゴリズムを組み合わせたもの
この研究では、マルチモーダル言語モデルの評価のためのフレームワークを開発します。このフレームワークは、マルチモーダル言語モデルの生成性とコントロール性を評価することができます。
Writing Individualized Education Programs (IEPs) is a high-labor, knowledge-intensive document burden; English
WhisperのようなマルチリンガルASRモデルの音声認識能力をDravidian言語で向上させるために、データセットと言語分析を用い、モデルをフィネチュアリングし、デコーダの不平衡を解消し、音声認識誤差を低減した。
予備情報が少ない場合や医療分野などの特定の分野の場合、分類タスクは難しいようになるが、この研究では、モデルが未分類データを操作して、分類モデルの性能を向上させる方法である、DecSelfMaskを提案した。
Prior work has shown that fine-tuning large language models on malicious or incorrect outputs in narrow domain
The emergence of reasoning multimodal large language models (MLLMs), which generate explicit chain-of-thought
Large language models (LLMs) sometimes exhibit language confusion when generating non-English text. Existing a
We describe our system for the SoccerNet 2026 Player-Centric Ball-Action Spotting Challenge, which requires pr
The dominant paradigm in video retrieval relies on embedding-based full-corpus scanning, which suffers from in
Image and video captioning are fundamental tasks that bridge the visual and linguistic domains, playing a crit
In this paper, we present XInsight Lab's solution to the micro-gesture classification track of the 4th MiGA Ch
Adapting large-scale pre-trained video generators for Video Super-Resolution (VSR) in novel domains remains co
Generating high-quality dexterous grasps remains challenging for learning-based methods, which often depend on
Vision-language-action (VLA) policies can deviate from nominal trajectories during manipulation, even when tas
Voice biometric systems face growing threats from spoofing attacks, yet the evaluation of detection models rem
Action-supervised fine-tuning of vision-language-action (VLA) policies fits demonstrations effectively but con
Long-horizon maritime trajectory prediction is important for shipping management, logistics planning, and mari
We present an online reinforcement learning (RL) algorithm for fine-tuning flow-matching policies in continuou
Recently, large time series models (LTSMs) have gained increasing attention due to their similarities to large
Unmanned aerial vehicles (UAVs) are increasingly being deployed in logistics, service robotics, and other real
Vision-Language-Action (VLA) models have demonstrated strong generalization in robotic manipulation, yet exist
Text-to-image diffusion models are increasingly deployed in open-ended creative contexts, yet their outputs re
Author name disambiguation is a critical challenge in academic search systems, often addressed through from-sc
We present a multilingual fact-checking system deployed at Factiverse, designed for high-throughput and low-la
Purpose - Quotation error refers to the inconsistency between cited information and its original source. This
Building Information Modeling (BIM) projects require information requirements to be described as machine-check
As Russia's war against Ukraine extends into generative AI, large language models (LLMs) adapted for local pos
Large language models answer knowledge-intensive questions using both parametric memory and retrieved evidence
We introduce Contrast Sensitive Flow (CSFlow), a weighting scheme that connects the human eye's Contrast Sensi
Low-Rank Adaptation (LoRA) enables efficient federated fine-tuning of segmentation foundation models for medic
The rapid advancement of generative models has blurred the boundary between synthetic and real imagery, creati
Vision-language models (VLMs) pretrained on large-scale image-text pairs demonstrate strong image-level unders
Vision-language models (VLMs) are powerful general-purpose reasoners, yet converting them into robot control p
Generative robot policies fail unpredictably at deployment: they hesitate at critical moments, drift off-task,
Tabular data is a primary medium for storing real-world information, driving many industrial applications of m
AgriGov is a curated, trilingual (English-Hindi-Marathi) dataset designed to address the scarcity of domain-gr
Simulating patients with large language models (LLMs) is a promising tool for mental health training, but exis
Text-to-SQL translates natural language into executable SQL queries. Few-shot in-context learning methods buil
Safety evaluations often infer latent motivations from behavioral patterns, but the construct validity of thes
Large Language Models (LLMs) have significantly propelled the advancement of edge intelligence and have been w
Enabling robots to understand and execute tasks from natural language commands while maintaining data efficien
Multimodal Large Language Models (MLLMs) have demonstrated remarkable success in visual understanding, yet the
Large Language Model (LLM) safety has often been evaluated at the behavior level, which provides limited evide
Current image editing software often hinges on fixed filters or expert tuning, leaving a gap between amateur u
Backdoor attacks in large language models (LLMs) are often treated as isolated trigger-response failures, moti
Modern large language model (LLM) agents can use external tools to help users solve complex tasks. However, fo
We are surrounded by various objects with movable, articulated parts, e.g., box, handle, door. An accurate and
In assisted teleoperation for human-robot collaboration, accurate intention prediction is critical for enablin
Robotics faces a fundamental challenge of data scarcity. Unlike language or vision research, there is no inter
Object navigation requires a robot to search for an unobserved target in an unknown environment by deciding wh
We propose Q-Guided Value-Gradient Matching (Q-VGM), an off-policy reinforcement learning (RL) method that tac
Adapting large language models (LLMs) to clinical workflows often requires costly fine-tuning or manual prompt
Navigation using a monocular camera is pivotal for autonomous operation on tiny aerial robots due to their per
Vision-Language-Action (VLA) models are emerging as a promising paradigm for robotic manipulation, enabling ge
本論文では、物理制約に基づく制約アダプタ
Autonomous cyber-physical systems (CPS) sit at the intersection of Model-Based Systems Engineering (MBSE) and
HANDOFFは、人間を模倣するロボットの制御を実現するために構築されたフレームワークです。ロボットはタスクを認識し、動作を生成します。HANDOFFは、タスクに合わせて動作を生成するアジエントを形成するために、教師と学
この研究では、地位認識を改善するために、地位認識と位置推定を統合した Meridian を提案します。
布物操作の学習システムを開発しました。このシステムは、人間が布物操作を学習できます。
policyがrobotによって異なり、sim-to-real gap、unknown payloads、同じロボットの異なるインスタンスの動的特性により、contact-rich、動的マニュピュレーションのためのpol
この研究では、人々が実際に操作を行っている場合に、人が視点を変更してカメラ動きを生み出しながら学習することの重要性を認識し、ActiveMimicというプレトランジングフレームワークを提案します。
Two-sided matching markets often involve information that unfolds over time through interviews, repeated inter
オンライン学習でオフラインデータを使用できるように、線形バンディットのアルゴリズムを提案する。
This paper proposes a two-stage pseudo anomaly-guided anomaly detection method (\textbf{T}wo-stage \textbf{P}s
Resource-constrained pricing controllers can make fixed-price inference impossible: the controller's resource
パルサーのタイミング残差を予測するために、長短期記憶ネットワーク (LSTM) を用いて提案しました。このLSTMは、小数数の時間残差に最も適しています。しかし、LSTMのトレーニングには時間がかかり、パルサー数が豊富な
実用的なデータセット内の自然的実験の特定と分析と、それを用いた実験結果について論じます。
スパイキングビジョン トランスフォームの量子の減少のために、物理学的に基づいた量子の削減方式を提案する。この方式は、モデルを物理的に削減する際に発生する不均衡を補正するために、モデルに特化した前処理と後処理を実施する。
スパイク式ビジョン変換模型(SVM)を圧縮するための削減法の開発と、それを用いた実験結果について論じます。
We present a single classification pipeline that combines an Equiangular Tight Frame (ETF) preprocessing stage
Foundation models (FMs) have achieved substantial success in generalizing across tasks without problemspecific
Surrogate-assisted evolutionary algorithms (SAEAs) have been widely used for expensive black-box optimization
In this work we study agents in simulated bargaining scenarios, where a buyer and a seller communicate through
Particle Swarm Optimization (PSO) frequently suffers from premature convergence. This paper introduces a famil
We study adversarial multi-armed bandits with and without delayed feedback under a safety-aware goal: achievin
この論文では、アノマリーディテクションにおける負の選択アルゴリズムを最適化するために、量子遺伝アルゴリズムを導入します。这により、検出器の生成効率を向上させることができ、精度も向上します。
これは、パフォーマンスの高いモデルサイズの減少を実現するために、Perforated Neural Networkがキーワード検出タスクに適用されていることを検証したり、Edge Impulseで動作するキーワード検出シ
We study whether simple algorithmic pricing systems can systematically produce collusive-like prices in multi-
We study a repeated information design setting in which the receiver, who is also the decision-maker, updates
Large Language Models exhibit mode collapse, producing homogeneous outputs that fail to explore valid solution
Reinforcement learning (RL) has enabled robust quadruped locomotion over complex terrain, but most learned con