AutoMegaKernel: A Statically-Checked Agent Harness for Self-Retargeting Megakernel Synthesis
AutoMegaKernel(AMK)は、Hugging Face Llama-family モデルを単一のパフォーマンスを最適化した CUDA Kernalで動作する単一のPersistent Cooperative
- 用途
- モデルを効率化する
- 難易度
- Hard
- コスト
- High
「LLM」の検索結果
40 件AutoMegaKernel(AMK)は、Hugging Face Llama-family モデルを単一のパフォーマンスを最適化した CUDA Kernalで動作する単一のPersistent Cooperative
自然言語から機械設計や技術図案などの正確な構成を作成することができるシステムを開発しました。このシステムは、Geometric Constraintsを満たす正確な構成を作成するために、Constraint DSL (D
Agentic reinforcement learning (RL) has become an important post-training paradigm for turning LLMs from stati
オンポリシーディストリレーションは、近年、重要なポストトレーニングの研究分野となりました。強い教師モデルを使用して学習トレッジを密に細かく指示することで、トピック認識を実現します。しかしなだな的にトークンレベルにおいてデ
分析研究は、LLM推論速度を速めるため、トークン、レイヤー、ヘッド、次元、注意パターンの削減技術である削減技術を適用し、広範なパラダイムとして成長しています。削減方法の実装によって、実現された加速の度合いは、ハードウェア
Clinical early warning systems built on electronic health records, in which clinical observations are recorded
Existing sparse attention and KV cache compression methods for long-context LLM inference typically apply fixe
Ensuring the reliability of Large Language Models (LLMs) under distribution drift requires inference-time adap
Court simulation bridges legal education and judicial practice, yet human-based simulations are costly and dif
この研究では、低リソース言語や絶滅言語の辞書のデジタル化が重要であるが、マルチモーダル辞書をデジタル化する方法は今まで難しかったが、この研究では、最近のビジョン言語モデルを用いて辞書のデジタル化が容易になり、辞書内の文字
Large language model agents increasingly rely on skills: reusable procedural documents encoding workflows, too
As large language models (LLMs) are increasingly applied to real-world legal tasks, evaluating the reliability
Large language models (LLMs) sometimes exhibit language confusion when generating non-English text. Existing a
Multi-modal Large Language Models (MLLMs) have achieved remarkable progress in video temporal grounding with r
Simulation plays a key role in automated robotics research supported by large language models (LLMs). However,
Mathematical reasoning has long served as a stringent test of machine intelligence; over the past decade, it h
Recently, large time series models (LTSMs) have gained increasing attention due to their similarities to large
Expert writing feedback from experienced researchers is critical for early-career scholars to improve their ma
Symbolic music evaluation for large language models remains fragmented across representations, datasets, and m
We present a multilingual fact-checking system deployed at Factiverse, designed for high-throughput and low-la
Chain-of-thought (CoT) reasoning has proven effective for enhancing problem-solving in large language models.
Palmprint modality offers a privacy-preserving biometric solution, yet its deployment is hindered by the domai
LLM agents increasingly rely on external inference conditions: prompts, tools, memory, SOPs, skills, and harne
Multimodal Large Language Models (MLLMs) have demonstrated remarkable success in visual understanding, yet the
Current open-weight large language models (LLMs) are prone to malicious finetuning attacks, which could compro
Human evaluation plays a critical role in assessing the quality of generated text. However, the reliability an
Recent agent frameworks such as Claude Code, Codex, and OpenClaw are strong at tool use and orchestration, but
Adapting large language models (LLMs) to clinical workflows often requires costly fine-tuning or manual prompt
Are tool-calling LLM agents equally safe throughout a conversation? We discover they are not: agents are most
この研究では、人間-ロボット 協力のためのDistributed Conversational Frameworkを提案します。
LLMがプログラムを変換する際の動態学を調査し、変換は収束し、制限された吸引領域に収束することが多いことを示す。
Safety alignment in LLMs does not improve monotonically across model generations. Studying four generations of
Current approaches to LLM adversarial testing suffer from coverage gaps: manual red-teaming does not scale, LL
LoMoは、画像とテキストの両方から情報を取り入れるモデルを作成するために、画像変換後のテキストをモデル内で使用できるようにすることで、ビジョンや言語の間の境界を越える能力を強化します。
ポーカーはIAの代表的な問題です。しかし、強いエキスパートレベルを達成するために、長時間にわたるトレーニングと解釈が必要とされてきました。LLMを使用すると、トレーニングやソルバーが不要となり、ポーカーをプレイすることが
LLM(大規模言語モデル)を利用してテキストパラメータを最適化するシステムを提案しました。このシステムは、単一のシステムでさまざまなタスク(単一タスク、複数タスク、未知の入力など)を実行可能でした。また、システムは、最適
LLM-guided evolutionary methods such as AlphaEvolve have proven effective in domains like math, systems resear
We present ARES-LSHADE, a memetic differential-evolution variant submitted to the GECCO 2026 competition on LL
インスタテストタスクの推論を高速化するために、スケーリングを適用して、推論時間を短縮することができる。
CoupleEvoは、大規模言語モデルを活用したカップルの最適化問題の自動ヒューリスティクーデザインアプローチを提案します。3つの進化的調整戦略が提示されます。