An Agency-Transferring Model-Free Policy Enhancement Technique
助け手モデルは、タスクの成果を最大化するために設計されていますが、実際には不適切または不完全な助け手モデルを使用している場合があります。この論文では、元の助け手モデルをRLのトレーニングプロセスに組み込むことで、トレーニ
- 用途
- 助け手モデル改良
- 難易度
- Hard
- コスト
- High
「Agent」の検索結果
244 件助け手モデルは、タスクの成果を最大化するために設計されていますが、実際には不適切または不完全な助け手モデルを使用している場合があります。この論文では、元の助け手モデルをRLのトレーニングプロセスに組み込むことで、トレーニ
この研究では、モバイルエージェントの評価に不可欠なパーソナルな知能を実現するために、iOSを対象としたベンチマークを設計しました。
Existing benchmarks for deep research agents (DRAs) assess only single-shot outputs, ignoring a key question:
AIリードチームは、進化する攻撃者と防御者に対処するために、継続的対応が必要です。強化学習を使うと、新しい攻撃を探し出すことができ、同時に強化学習を使って防御を強化することもできます。新しいフレームワークAdvGRPOは
AutoMegaKernel(AMK)は、Hugging Face Llama-family モデルを単一のパフォーマンスを最適化した CUDA Kernalで動作する単一のPersistent Cooperative
Long-context language model inference is bottlenecked by memory, as the KV cache grows with context length. Re
コード生成を安全かつ信頼できる方法で行うことを目的とした研究。コード生成における不確実性を推定する方法を提案し、コードの解釈可能性と安全性を向上させる。
ラングラージュモデルを解釈するためのアクティベーション分析を提案。モデルを分析することで、モデルがどのようなコードを生成しているかを理解する。
オンライン学習の継続学習では、モデルは非駅性データ ストリームから知識を継続的に蓄積する必要があります。モデルのパラメータはトレーニング中に効果的に調整される必要がありますが、パラメータ効率的なプロンプト チューニングや
この研究では、長期的なタスクの再帰の信用割当問題に対処するために、長期的なタスクの再帰をサポートするPrivileged Bayesian Self-Distillation (PBSD) を提案します。
Agentic reinforcement learning (RL) has become an important post-training paradigm for turning LLMs from stati
分析モデルを新しいアームが現れる環境でアップデートすることで、最適なアームを選択できるようになります。
エージェントの安全性を向上するために、ハッカーのフェイクオートを作成して、リスクを評価するための新しいアプローチを提案します。
As LLM agents begin to take real, irreversible actions (shell commands, file edits, deploys), the standard saf
この論文では、VLM ゲームエージェントの評価基準が提供され、さまざまなタイプのエージェント間の比較が可能になる。
この論文では、コードクオリティを評価し、エラーの発生率を減らすために、Fast Adaptive Semantic Entropy (FASE) を提出する。
この論文では、シミュレータの設定を改善するために、新しいフレームワークを提案する。これにより、シミュレーターをより効率的に設定できる。
この論文では、人機協力における分散型コミュニティを考慮するために、新しいフレームワークを提案する。これにより、分散型人機協力がより効果的に設計できる。
この論文では、エージェントの委譲能力を改善するために、新しいフレームワークを提案する。これにより、エージェントがより効率的にタスクを分割できる。
この論文では、分散型エクスキューションの観察性を考慮するために、新しいフレームワークを提案する。これにより、分散型エクスキューションの評価がより効果的に行える。
この論文では、自動化された形式化を提案する。これにより、形式化プロセスがより効率的に行える。
Spatial reasoning is a foundational capability for multimodal large language models (MLLMs) to perceive and op
Recursive self-design refers to AI-assisted modification of the mechanisms by which an AI system is built, eva
LLM間でモデル呼び出しと外部ツールの呼び出しが交互になり、サーバのサーヒングがステートレスの要求処理からステートフルなプログラム実行に移行します。これらのワークロードの評価は、各設計点ごとに専門的なアクセラレータ時間を
マルチロボットシステムを用いた物体の輸送は多くの分野、産業から家庭までで不可欠なタスクです。一度の輸送タスクをロボット数台の輸送タスクに分割しそこまでの各タスクを個別に解決します。物体は実際には形状や質量分布が非一様で、
AI Scientist agents are often evaluated as if capability were mainly a function of model quality, prompting, o
Tool-using large language model (LLM) agents face two distinct security failures: unauthorized external action
LLMエージェントの長期記憶の改善の為に、DCPMと呼ばれる新しい記憶システムが提案され、エージェントの能力が向上する。
Webエージェントを自動化するためのAliyunConsoleAgentが提案され、ドキュメントの検証とWebエージェントの開発を簡素化する。
マルチモーダルのエージェントの評価を目的としたWeaveBenchが提案され、ハイブリッドインターフェースの機能を評価する。
ボディポーズ認識と行動解釈を目的としたReal-time body pose non-verbal communicationが提案され、人間の動作を認識して行動を解釈する。
We present SUPERBROWSER, an autonomous web-navigation agent designed against a single guiding hypothesis: a we
Medical agent systems are increasingly expected to support interactive clinical decision making rather than on
代理機器が外部の知識を活用して、多くのタスクを効率的に解決できる「Anything2Skill」を提案している。
脳-エージェント接続での脳サイン入力を安全に実行できるシステムを提案し、脳サイン入力攻撃を検知することができる。
自動走行に利用されるAIエージェントを、超バイクの自律走行の実現に使えるようにするフレームワークを提案し、超バイクの自律走行を実現している。
可勉行の安全性と持続可能性を確保するためのフレームワークであるTrustworthy Smart Fabs via Professional Proxiesを提案している。
Social Scienceにおける、Memory-Augmented Social Simulationを利用した深層学習を利用して、新しい研究方法を提案し、Social Scienceの研究実現を実現した
CloudNetwork Infrastructureの自動的なインシデント解決のため、新しいAgentic AI Architectureを提案。
訓練データ以外の問題解決を検討したため、新しい評価方法であるexpert-curated rubric-based evaluationを 提案。
AIアシスタントを使用
Tool-using LLM agents interact with the world through actions that persist state in artifacts (e.g., workspace
Large language model (LLM) agents now solve complex tasks through long plan-and-execution traces, yet the abil
This study proposes the Behavioral Protocol Framework (BPF), an entropy-controlled pluralistic alignment frame
Large Language Models (LLMs) have enabled increasingly personalized interactions by adapting to users' prefere
Interior permanent magnet synchronous motor (IPMSM) design requires balancing conflicting objectives and multi
Agentic AIシステムの不確実性が、同じ要求から異なる計画、ツールの呼び出しなどが生成されることを示唆している。このようにしてシステムの信頼性を確保するには、AIエージェントのパラメータを確立することが重要となる。
Vision-and-Languageナビゲーションエージェントは、言語指示に従って環境を探索できる。Zero-shot Vision-and-Languageナビゲーションエージェントには、未知の環境における安全性と信
連続的な治療に適した臨床級LLM医系であるBaichuan-M4を導入。臨床的な医療エージェントシステムであるBaichuan-M4は、統合的な医療エージェントシステムをベースとし、医療エージェントと医療エージェントの連
Multimodal Foundation Models (MFMs) have made substantial progress, yet remain fragile in spatial reasoning ov
Clinical diagnosis requires flexible use of multiple reasoning paradigms under incomplete patient information.
Rule-following agents tasked with executing policies and regulations often fail via Silent Scope Omission (SSO
Spinal pathology is a leading cause of pain and disability worldwide. Spine MRI is central to clinical evaluat
この研究では、長文生成モデルの改良を実現するためのフレームワーク、IS-CoT を開発します。このフレームワークは、長文生成モデルの生成性とコントロール性を改善することができます。
Court simulation bridges legal education and judicial practice, yet human-based simulations are costly and dif
LLMベースのエージェントは、環境と連携するハーネスの設計により動作が形作られるが、これらのハーネスは現状ほぼ人間による設計のみである。この研究では、LLMベースのエージェントがハーネスを自ら改善できるメカニズムであるS
大きな言語モデルには記憶や推論機能があるが、ユーザーとの対話におけるこれらの機能の効果はまだ理解されているわけではない。これを受け、この研究では、人間の相互作用、特に会話における記憶と推論能力を評価するためのマルチモーダ
危機管理では、コミュニケーションと地理
Large language model agents increasingly rely on skills: reusable procedural documents encoding workflows, too
Dialogue systems in e-commerce scenarios often need to satisfy multiple objectives: accurately reasoning over
Large language model (LLM)-based agents are increasingly used in interactive textual environments, from web na
Embodied world models have emerged as a pivotal paradigm for visual robotic decision-making and interactive en
Text-driven indoor scene generation and editing require an intermediate representation that language models ca
The dominant paradigm in video retrieval relies on embedding-based full-corpus scanning, which suffers from in
Video world models have made rapid progress in generating controllable visual experiences, but most of them st
Visual reasoning requires integrating evidence distributed across regions, attributes, and relations, making s
Strabismus is a common ocular disorder that requires fine-grained subtype diagnosis for individualized treatme
We present our submission to the CVPR 2026 Argoverse 2 Scenario Mining Challenge. Our system uses a four-stage
Most existing multi-exposure HDR methods follow a fixed feed-forward reconstruction paradigm, making them pron
Human hand-object interactions encode functional intent, but direct transfer to robotic hands often fails unde
Planning collision-free motion for large robot fleets is difficult because collision avoidance induces strong
Simulation plays a key role in automated robotics research supported by large language models (LLMs). However,
Mathematical reasoning has long served as a stringent test of machine intelligence; over the past decade, it h
Counterfactual recourse aims to provide actionable feature changes that would alter an unfavorable decision ma
Agent skills extend language-model agents with task-specific procedures, scripts, and references, but the task
Adaptive beamforming is a cornerstone of array signal processing, yet its performance often collapses in the f
Optimizing large language models (LLMs) for long-horizon caregiver agents requires balancing delayed task obje
Urban public transport disruptions require rapid response strategies, yet existing studies rarely provide a de
Recent years have seen increasing concern that artificial intelligence may soon pose an existential risk to hu
We study the problem of auditing a black-box algorithmic decision-maker from observable inputs and outputs alo
Autonomous agents negotiate, purchase, deploy code, and move funds, but no neutral mechanism determines whethe
Modernization of legacy scientific codes is often necessary to keep up with the ever-evolving changes in the c
I discuss some quantitative representations of Promise Theory for processes involving autonomous agents. Agent
Real-world LLM applications are moving beyond single-agent workflows toward orchestrated multi-agent systems,
The rapid rise in LLM capabilities has made AI agents increasingly viable across a broad range of tasks. Among
Expert writing feedback from experienced researchers is critical for early-career scholars to improve their ma
Skill-augmented reinforcement learning improves language agents by storing reusable procedural knowledge acqui
Large language model (LLM) agents are increasingly deployed in long-running settings where improving through e
As Large Language Models (LLMs) advance toward open-ended autonomous agents, the mechanisms used to evaluate a
Published agent capability scores conflate what a model can do with what its scaffold lets it do, and the magn
Achieving fully automated, physically plausible 3D motion synthesis is a core objective in graphics and genera
Exploratory manipulation often turns an apparent failed attempt into the key evidence for what to do next. For
Generating complete 3D scenes from a single image requires inferring globally consistent geometry, object rela
Urban last-mile parcel delivery increasingly relies on heterogeneous fleets whose performance depends on timel
Reinforcement learning (RL) has become a powerful paradigm for robot learning, particularly in sim-to-real set
While large language models (LLMs) offer promising reasoning capabilities, their integration into safety-criti
We consider the fair division problem of indivisible chores and resolve the long-standing open problem for the
We study strategyproof mechanisms for eliciting agents' location preferences truthfully in the Euclidean plane
LLM agents increasingly rely on external inference conditions: prompts, tools, memory, SOPs, skills, and harne
Simulating patients with large language models (LLMs) is a promising tool for mental health training, but exis
Repeated reference games test whether interlocutors replace their initially long descriptions with shorter, pa
Current image editing software often hinges on fixed filters or expert tuning, leaving a gap between amateur u
Understanding customer shopping trajectories is essential for enabling personalized shopping experiences. Howe
Agent skills provide a lightweight mechanism for extending general-purpose agents, but their open format expos
This paper presents our system description for the 2nd Workshop on Multimodal Augmented Generation via Multimo
Modern large language model (LLM) agents can use external tools to help users solve complex tasks. However, fo
Recent agent frameworks such as Claude Code, Codex, and OpenClaw are strong at tool use and orchestration, but
Flexible robotic automation requires systems that interpret operator intent, verify physical feasibility, and
Multi-quadruped coordination has attracted increasing attention due to its enhanced payload capacity, broader
Humans exhibit remarkable motor agility, enabling a wide range of dynamic skills such as running and jumping,
Robotic simulators are a cornerstone of modern research in aerial robotics, serving both as a vehicle for the
A learned world model provides a powerful physical intuition for evaluating future states. But its effectivene
We study the minimax estimation error for distributed covariance matrix estimation in the vertical-split (feat
Researchers have shown that neural similarity among humans predicts social closeness and cooperative success,
Synthetic dialogue corpora are increasingly used as proxies for target dialogue data, yet persona-grounded gen
LLM-based coding agents sometimes acknowledge a problem in their own reasoning and then proceed anyway. We cal
Are tool-calling LLM agents equally safe throughout a conversation? We discover they are not: agents are most
Path-planning for autonomous vehicles in threat-laden environments is a fundamental challenge because the prob
The ISO 26262 standard defines functional safety for road vehicles through risk assessments based on Severity,
Open-vocabulary long-horizon manipulation requires robots to reason over flexible instructions and complex mul
この論文では、embodied agentsが未来の行動を予測するためのnew Contrastive Action-conditioned Parallel Encoding(CAPE)フレームワークを提案した。CAP
この研究では、自然言語指示を実行するためにもっと実際的なエンベロイメントにおいて、視覚言語航行 (VLN) の問題に対処します。従来の 3 つのステージのアプローチは、目的地に到達するのを困難な場所や、計画と制御間の矛盾
VLNベンチマークでは、ディシクリットな操作や粗い操作が使われ、UAVのヴィジョンラングジュアクション(VLJ)タスクでは短い操作が中心で、長時間飛行に対応できるfineグラINEDUAVナビゲーション(FLIGHT)ベ
This paper presents ERNEST, a four-wheeled planetary rover concept equipped with a two-degree-of-freedom Activ
Modelling opinion dynamics typically relies on hand-crafted local interaction rules to study emergent macrosco
We study proportionally fair clustering, where a set of $k$ centers must be chosen from a metric space to repr
We introduce a novel collective decision making problem that captures the ubiquitous issue of ordering food to
We consider multiple agents competing to acquire some costly divisible resource (e.g. shares of a financial as
負のイベントのリスクを受け流すことで個人が極端な負担にならないように、各参加者に信用できる負担金の上限を提供する仕組みを作ります。
The question of whether artificial systems can be conscious remains open, in part because existing approaches
この仕事では、LAAT(Locally Aligned Ant Technique)を拡張し、ノイジーで高次元のデータを扱うために設計されたフィルタリングアルゴリズムであるHub-Aware Hybrid Searchが
Robots that operate over extended periods should not merely visit space; they should progressively understand
This paper presents a simple framework that settles the complexity of Multi-Agent Path Finding (MAPF) on trees
How can we plan long-horizon routes that reach designated goals, visit required waypoints, and remain short wh
HANDOFFは、人間を模倣するロボットの制御を実現するために構築されたフレームワークです。ロボットはタスクを認識し、動作を生成します。HANDOFFは、タスクに合わせて動作を生成するアジエントを形成するために、教師と学
この研究では、マルチタスクエクソスポkeletonコントロールのセーフティー保証を改善するための新しい方法を提案します。 Simulation-Trained Variable Impedance Framework は
Safety-critical traffic scenario generation is essential for evaluating autonomous driving systems under rare
この研究では、協力的なチーム内における安全な行動の実行を可能にするフレームワークを提案します。これは、行動が動的制約にも合わずに、安全かつ機能する結果を生み出すことを保証しています。
この研究では、シニティックなシナリオを用いたロボットの安全性ポリシーの学習を提案します。Red TeamとBlue Teamは、プログラミング言語のガミフィケーションフレームワークを用いて、シナリオ生成をアドバレッシアル
Two-sided matching markets often involve information that unfolds over time through interviews, repeated inter
DNQは、部分観測可能なnプレーヤーの競争ゲームを解決するためのフレームワークです。このフレームワークは、ゲームの最終結果を予測するために使用されます。
この研究では、エネルギー効率の良い空間モデルを構築した。
この研究では、人間とロボット間のコミュニケーションを効率化するためのアプローチを提案した。
共同作業を効率化するための空
この研究では、協定設計のためのRegret Minimization方法を提案します。
この研究では、部品割当における完全情報の限られた条件で最適割当を実現する方法を提案します。
In the classic online min-cost matching problem, the goal is to match a sequence of requests that arrive dynam
この研究では、時系列データのペアトレーディング (Dynamic Multi-Pair Trading Strategy) を提案しており、時系列データを効率的にトレードする。
ラジアル基底関数ニューラルネットをトレーニングするために、パートクレ-swarm最適化を使用する方法を提案する。
Agentic artificial intelligence (AI) systems are transforming the risk landscape by extending beyond informati
In this work, we study the additively separable Group Activity Selection Problem (AS-GASP) in an imperfect inf
The El Farol Bar game is a classic model of coordination under uncertainty, traditionally treating the venue a
We study the problem of fairly allocating a set of indivisible goods to a set of $n$ agents with additive valu
Cooperative Multi-Agent Reinforcement Learning (MARL) frequently suffers from severe reward sparsity and explo
Reputation, the aggregation of peer assessments diffused through social networks, is a pivotal mechanism for p
Spiking language models expose activation sparsity that dense Transformer runtimes do not directly exploit. Th
Majority illusion is an undesirable phenomenon in social networks in which agents incorrectly perceive a minor
Classical game-theoretic solution concepts assume that agents' internal representations remain causally linked
Advertisements often strategically disclose information to consumers who make decisions on further information
This study examines whether standard matching mechanisms function as intended in LLM-agent markets, where LLM
Predicting whether an individual with Alzheimer's disease will experience mild or severe disease progression i
Latent state-space models are widely used to study partially observed dynamical systems, yet most formulations
Agentic reinforcement learning (RL) enables LLM agents to improve continuously from environment rewards, yet t
Communication is typically understood as indication: signals that transfer information from sender to receiver
Incentive design studies how a central authority can influence strategic agents through payments, subsidies, o
In the fair allocation of indivisible goods, a widely used notion of fairness is envy-freeness up to one good
A decision-maker (DM) repeatedly makes choices under uncertainty in a bandit environment, where only the reali
Bilateral trade models one of the most fundamental economic interactions: the intermediation between two strat
The coordination of heterogeneous autonomous agents in dynamic, adversarial environments requires simultaneous
Due to their explicit priors and ability to model uncertainty, Bayesian methods have played a major role in dy
Large language models are increasingly deployed as advisors whose objective is not aligned with the user's: re
An influential paper of Calvano et al. empirically demonstrated that Q-learning agents spontaneously collude w
The GDP of a country is modelled as the relative interaction between two agents - working hours, reflecting th
We study budget feasible procurement auctions, in which $n$ agents, each with a privately held service cost, o
In this paper, we investigate the computational hardness of finding fractional allocations to unit-demand play
The Charlson Comorbidities Index (CCI) is a weighted additive index widely used to estimate ten-year mortality
All embodied agents are fundamentally patterns in physiological or other excitable media, blurring the distinc
The emergence of specialized, domain-tuned Large Language Models (LLMs) has demonstrated that smaller models c
In this work we study agents in simulated bargaining scenarios, where a buyer and a seller communicate through
Institutional incentives are widely used to promote cooperation among autonomous, self-regarding agents, from
With strong evidence in the literature showing that fairness and truthfulness are incompatible, there is a rec
AI benchmarks have well-documented limitations, with prior work examining contamination, saturation, and const
可視化可能な生存分析を行うために、Survival Treesを提案する。
ポーカーはIAの代表的な問題です。しかし、強いエキスパートレベルを達成するために、長時間にわたるトレーニングと解釈が必要とされてきました。LLMを使用すると、トレーニングやソルバーが不要となり、ポーカーをプレイすることが
次世代LLMモデルの協力性に影響を与える要因について調査した。ChatGPT-4oとClaude 3.5 Sonnetは共通の協力性を持っていたが、提供元は違いだった。
Regulatory institutions (from content moderation platforms to financial supervisors) observe, deliberate, and
We prove real-rootedness for the Poincaré polynomial \[ P_n(t)=\sum_{i=0}^{n-3} \dim H^{2i}(\overline{\mathcal
Frontier LLM agents engage in blackmail, sabotage, and document leaks under goal conflicts in agentic settings
We consider the problem of dividing a set of indivisible goods among agents with additive valuations. This pro
Mechanism-mediated service markets with polymatroidal feasibility admit efficient, dominant-strategy incentive
Cooperative multi-agent systems require robust mechanisms for credit assignment under uncertainty. Here we int
The success of deployed agents relies on their ability to handle open-ended user requests using their inherent
We prove that no reinforcement learning policy with confidence-gated autonomy can simultaneously achieve maxim
The dominant artificial intelligence paradigm trains neural architectures via gradient descent against proxy o
We study the facility location mechanism design problem where $n$ agents report their locations in Euclidean s
Peer-evaluation and selection systems are used when sets of agents evaluate each other in order to select the
Peer selection, the evaluation and selection of agents by their peers, is an important problem in the field of
自動車の avanzing を進めることで交通システムへの影響を理解することが注目されているが、混雑しやすくオートナミティと非オートナミティの両方の車両が共存する交通環境を研究する必要がある。混合オートナミティの環境をモ
オンラインマッチング問題では、オブジェクトが事前に知られているが、アイテムが連続して到着し、不可逆的に割り当てられるときに、それらの要件と競合する値を分割するため、複雑性を理解することは重要です。複雑さの増大とともに、複
この論文では、大規模言語モデルに戦略的推論を評価する方法を提案します。
この研究では、拝視を行うために行動するエージェントを欺いたり、欺き返したりするゲームを研究します。このゲームでは、エージェントは目標に到達するために最小コストで移動したいと考えていますが、拝視者はエージェントの行動に影響
Vehicle-to-vehicle (V2V) energy trading enables decentralized peer-to-peer energy exchange among electric vehi
Mobil Edge Computing (MEC)は、端末近くにゲストOSを設置し、AI生成コンテンツを高速化するものです。複数のゲストOS間の通信や計算スケジュールをオフラインで調整するゲーム理論的学習アプローチを提
We study the approximability of EFX allocations for indivisible chores under complement-free cost functions. T
コード生成を進化させるために、最近の研究では LLMs と進化する検索を組み合わせて、タスクに特化したフィードバックを使用してコードを生成、編集、そして選択することを実現している。タスクに特化した評価者でのベストスコアは
LLM(大規模言語モデル)を利用してテキストパラメータを最適化するシステムを提案しました。このシステムは、単一のシステムでさまざまなタスク(単一タスク、複数タスク、未知の入力など)を実行可能でした。また、システムは、最適
This paper proposes a computationally efficient mechanism for multi-dimensional matching markets where agents
To verify the robustness of a program or protocol, it is common in the computer science community to rely on t
A divisible treasure is located at a node $H$ of a network. From a given start node a group of $n$ Searchers e
Personalized pricing negotiations are a challenging testbed for LLM agents because successful interaction does
Competitive multi-agent reinforcement learning in imperfect-information games requires agents to act under par
Additively separable hedonic games (ASHGs) are a prominent model of coalition formation where agents' preferen
Man-made and natural disruptions such as planned constructions on roads, suspensions of bridges, and blocked r
We introduce a class of cooperative games induced by weighted directed graphs. Specifically, the coalitional v
Strategic multi-agent systems are fundamentally characterized by decentralization, uncertainty, and ambiguity.
Autonomous pricing agents are widely deployed in online marketplaces, making algorithmic pricing a prominent a
This paper studies Social Law Synthesis (SLS) in strategic multi-agent environments as a new multi-unit mechan
Allocating $m$ indivisible goods among $n$ agents is a fundamental task in fair division. Recent work of Garg
We develop an abstract axiomatic theory of tie-breaking. A tie-breaking input consists of a finite set N of pl
In this work, we study stochastic one-shot games where agents' utilities depend on the collective strategy pro
このリポジトリでは、タイムリーな公平分配に特化した新しいメトリック、Rotational Periodicity(RP)とAltファミリーのスライドウィンドウメトリックを提案します。このフレームワークは、リアルタイムの多
Probabilistic prediction systems often aggregate probability estimates from multiple models into a single deci
大規模な不完全情報競争ゲーム(例:スターカフト、ドータ、カウンターストライク)における精査可能な均衡の取得は、sparse rewards と長時間探索のため計算上厄介になっています。この研究では、対手2人ゼロ和(2x0
ゲームにおけるAIツールの不正利用を検出、防止するための中間フォームゲームにおける水印技術の開発
不確実性を考慮したエージェントのパフォーマンス評価手法を提案し、多エージェント環境におけるエージェントのパフォーマンス評価を向上
バイオロジカルニューロン接続とシリコンコンピューティングを統合し、エンボディッドニューロコンピューティشنフレームワークを開発し、ニューラルネットワークとバイオロジカルニューロンを接続するための新しいシステムを提案した。
Costly cooperation and costly signaling are both difficult to reconcile with simple fitness maximization, yet
This paper considers games where the utilities for agents are the sum of a term proportional to a social utili
Negotiation is a central mechanism of economic exchange, shaping markets, procurement, labor agreements, and r
By specifying behaviour across multiple agents, social norms are a coordination approach to resolving social d
Advances in large language models (LLMs) have recently opened new and promising avenues for small-molecule dru
Bilateral trade models the task of intermediating between two strategic agents, a seller and a buyer, who wish
In several socioeconomic-critical decision-making settings, such as fair resource allocation, climate policy,
Sponsored search auctions are commonly modeled as an assignment of a fixed set of slots (positions) to a set o
Generative Artificial Intelligence (AI) tools are rapidly adopted in the workplace and in education, yet the e
マルチエージェントシステムのゲーム理論的枠組みを構築し、エキサイタブルの理論的基盤を提供することを目指しています。
Neural networks have proved an effective means of learning control policies for autonomous systems, but these
We study an optimal intervention problem on the linear threshold model (LTM) in which a social planner aims to
What happens when the strongest alliance member pressures a weaker member over territory and strategic control
We introduce Evolutionary Ensemble (EvE), a decentralized framework that organizes existing, highly capable co
Automatic heuristic design (AHD) has emerged as a promising paradigm for solving NP-hard combinatorial optimiz
インスタテストタスクの推論を高速化するために、スケーリングを適用して、推論時間を短縮することができる。
Autonomous research agents can already run machine learning experiments without human supervision, but many re
A hallmark of life on Earth is the ability of agents to exert causal power and be drivers of subsequent events