MLinfo | 機械学習・AI論文まとめ

Barzilai-Borwein Fails Superlinear Convergence on an Open Set of Quadratics for Every Dimension $n\geq 4$

バルザリ＝ボレイン法のスーパー非線形収束問題に関する論文を発表しました。この論文では、バルザリ＝ボレイン法が非線形収束できないオープン集合のすべての二次型問題に対してスーパー非線形収束できないことを示しました。これは、強

コンピュータビジョンセグメンテーション

用途: 最適化アルゴリズムの検証
難易度: Hard
コスト: Medium

自然言語処理大規模言語モデル異常検知テキスト強化学習

Training Large Language Models for Self-Explanation Faithfulness

この研究では、自己説明の信頼性を検証するためのRL方法を提案し、自己説明の信頼性を直接最適化するための新しいアプローチを検討します。

用途: 自己説明の信頼性
難易度: Hard
コスト: High

arxivGitHubあり2026-07-23

Identifying Good Rules for Efficient SAT Encodings of Single-Constant Multiplication Using Machine Learning

机械学習モデルを用いて、指定された数値定数に掛け算する方法を効率的に探索します。在来の dinamic programming法は効率が高いが、定数の大きさに対応できません。この研究では、神経符号学的アプローチにより、定

品質予測/異常検知深層学習グラフニューラルネット

用途: 数値定数乗算最適化問題解決
難易度: Easy
コスト: Medium

Representative Sets in Propositional Abduction

表現的推論問題とは、与えられた現象に対して説明が見つかることを目的とした問題です。この研究では、解決方法を最適化するために、代表集合 (representative sets) の概念を活用します。

機械学習教師あり学習分類

用途: 表現的推論問題の解決
難易度: Hard
コスト: Low

AttriMem: Attribution-Guided Process Feedback for Agent Memory Learning

代理記憶の学習は、LGMが効果的に情報を保持・更新・処理できることを意味します。この研究では、アトリビューテッドグラフィックフィードバックを使用して、代理記憶を最適化する方法を提案します。

自然言語処理大規模言語モデルQA

用途: 代理記憶の学習
難易度: Hard
コスト: High

品質予測/異常検知深層学習Transformer画像テキスト動画

Beyond Independent Optimization: Compression, MoE Routing, and Quantization Interactions in Multimodal Edge Intelligence

効率的な多モードの推論は、モデルの性能やFLOPCOuntだけでなく、移動、キャッシュ、変形、量化された表現を保存するコストやメモリ、エネルギーに関する制約にも制限されています。この論文では、最近のビジュアルトークン圧縮

用途: 分析的コストと効率性を向上させるための多モードのエッジAIの効率化
難易度: Hard
コスト: High

Search Hardness-Aware LLM-Based Problem Formulation for Expensive Simulation-Driven Design

シミュレーション駆動設計では、高精度なシミュレーションを少なくすることで設計を実現しています。既存の手法では、その問題に取り組むために最適化アルゴリズムが改善されてきましたが、問題の定義自体は検討されていません。この論文

深層学習軽量化・量子化生成

用途: コスト削減的なシミュレーション駆動設計
難易度: Hard
コスト: High

Variance-reduced Domain Adaptation using Paired Sampling

この研究では、分配マッチングにおける高変動の削減に伴い、最適化の安定化、精度の向上を実現するために、paired サンプリングという新しい手法を提案した。

コンピュータビジョンセグメンテーション教師なし

用途: 分布マッチングにおける高変動の削減
難易度: Hard
コスト: High

An Isotropy-Preserving Spectral Cap for Muon: Theory and Three Case Studies

language モデルを前訓練するために、Muon などの矩式最適化を使用するが、これらのモデルの内部幾何学を保持する方法についてはよくわかっていない。仮定から、モデルの内部幾何学を安定化するために、SGDに内在するb

深層学習正規化・最適化手法テキスト

用途: モデルの内部幾何学の安定化
難易度: Hard
コスト: High

品質予測/異常検知自然言語処理大規模言語モデル生成

DQAOA-GPT: AI-Accelerated Distributed Quantum Optimization for Combinatorial Problems

組み合わせ方程式の最適化を解くための新しいフレームワークを提示した。分布される量子アルゴリズムの局所的な制限に直面する際、最適化の解を導けるために、分布される量子近似最適化アプローチと深層学習アルゴリズムを組み合わせた。

用途: 方程式組み合わせの最適化
難易度: Hard
コスト: High

Look Less, Think Faster: Joint Token-Compute Adaptation for Multimodal LLMs

多モーダルラージランゲージモデルは、視覚言語タスクに強いですが、高い推論コストで問題となっています。Look Less, Think Fasterアルゴリズムは、単位次元を個別に最適化することで、多モーダルラージランゲー

深層学習軽量化・量子化画像テキストマルチモーダル

用途: 多モーダルラージランゲージモデルによる視覚言語タスクでのコスト削減
難易度: Hard
コスト: High

arxivGitHubあり2026-07-22

Evolving Cache Schedules for Fast Diffusion Policy Inference

分散式推論には、高解像度ビデオ生成のためにコストが高いという問題があります。Evolving Cache Schedulesアルゴリズムは、コストと効率性のトレードオフを最適化することで、キャッシュで推論コストを削減しま

深層学習Transformer生成

用途: 分散式推論のためのキャッシュスケジュールの進化
難易度: Hard
コスト: High

Fundamental limits of distributed multiclass classification from simple binary decisions

分類タスクの性能を最適化するために、分布化されたクラスター間の分離を考慮したアルゴリズムが提案されていました。

機械学習教師あり学習分類

用途: 分類タスクの性能を最適化する
難易度: Hard
コスト: Low

Boundary-Adapted PINNs for Elliptic Dirichlet Problems: $H^2(Ω)$ A Priori Error Bounds with Application to Mean Escape Time Computation

この研究では、Oceanモデルを使用して、オーシャンで不完全な観測を使用する可能性と、生成的ステートスペースモデルと最適化フレームワークを使用して直接不完全な観測から学習する能力を評価します。

強化学習方策勾配 (PPO / A3C)テキスト

用途: Oceanモデルにおける不完全な観測の使用
難易度: Hard
コスト: Medium

Optimizing Regret

決定関数とコストの関数間の共変性により、損失関数を最適化することで、適切な行動決定を可能にすることができます。また、これに基づいて、共変性の傾向を最適化する方向性を考察し、正確に予測された結果を持つモデルを導出するのに役

自然言語処理大規模言語モデル

用途: 適切な行動決定のための損失関数の最適化
難易度: Hard
コスト: High

The Price of Hidden Curvature: An $\widetildeΩ (d^{5/4} \sqrt{T})$ Lower Bound for Bandit Convex Optimization

この文書では、バンディット型凸最適化の最小公倍数期待誤差について、最初の非ゼロの誤差下限を提案しました。これは、2次元空間で構成された凸関数のハードクラスであり、ドメインのサイズdとデータ数Tの関数です。

コンピュータビジョンセグメンテーション

用途: バンディット型凸最適化の下限
難易度: Hard
コスト: Medium

説明可能深層学習Transformer生成強化学習

Stale but Stable: Staleness-Adaptive Trust Regions for Stabilizing Asynchronous Reinforcement Learning

離散RLは、長所と短所を含む複雑なランク付けゴールの最適化に効果があります。しかし、その計算コストは通常高く、自動微分化などの複雑なグラadientsの計算アラウンドを必要とします。この文書では、長所と短所を含むランク付

用途: 離散RLアルゴリズムの性能アップデート
難易度: Hard
コスト: High

CRB-Driven Beamforming and Trajectory Optimization for UAV-assisted ISAC System

UVAを用いたISACシステムを構築し、ISACシステムの動作の最適化を行うためにCRBを利用したビーム形成法とパス追従法を提案した。

センサ/時系列自然言語処理RAG強化学習

用途: UVAを用いたISACシステム
難易度: Hard
コスト: Low

arxivPaper only2026-07-20

Optimizing the Preconditioner: A Black-box Online-to-Nonconvex Conversion with Static Regret Minimization Oracles

この研究では、非凸最適化をオナミ式最適化と変換する方法を提案します。この変換は、静的遺憲最適化の学習者が順列的グレードトラッカーを維持し、静的遺憲最適化では選択できるプレダクターコンパラタートを選択することで実現されます

コンピュータビジョンセグメンテーション

用途: 非凸最適化のバックボックス変換
難易度: Hard
コスト: Medium

arxivPaper only2026-07-20

LLM-as-a-Coach: Experiential Learning for Non-Verifiable Tasks

この研究では、ルビック評価を含む非確認タスクの最適化を目的とします。従来のRLには、モデル評価の情報が使われるだけですが、モデル自身は反省や自己改善はすることがありません。ここでは、LJMをコーチとみなして、モデルが反省

品質予測/異常検知深層学習軽量化・量子化テキスト強化学習

用途: ルビック評価を含む非確認タスクの最適化
難易度: Hard
コスト: High

arxivPaper only2026-07-20

Task-Space Constrained Stochastic Trajectory Optimization for Time-Optimal Forestry Crane Motion Planning

自律運航のクレーンは、木材の移動を安全かつ効率的に行う必要があります。このため、木材の運搬におけるコスト削減と安全性の確保のために、クレーンの運動計画を最適化します。この研究では、VP-STO(Via-Point-bas

深層学習軽量化・量子化

用途: 伐木のコマーシャル用クレーンでの操作
難易度: Hard
コスト: Low

arxivPaper only2026-07-17

On the Role of Normalization in Binary Iterative Hard Thresholding for 1-bit Compressed Sensing

1ビット圧縮センシングは、情報が圧縮された状態で保存され、データ量の最適化が必要で、この問題を解決するために、Binary Iterative Hard Thresholding（BIHT）を最適化する方法を提案。

説明可能センサ/時系列コンピュータビジョンセグメンテーション

用途: 1ビット圧縮センシングの最適化
難易度: Hard
コスト: Medium

arxivPaper only2026-07-16

Tamed Stochastic Gradient Hamiltonian Monte Carlo

機械学習では、オプティマイザはモデルを最適化するために重要な役割を果たします。この研究では、オプティマイザの開発に基づいて、機械学習モデルの最適化を高速化する方法を提案した。

自然言語処理RAG

用途: 機械学習のオプティマイザの開発
難易度: Hard
コスト: Low

arxivPaper only2026-07-16

What's in a Smoothness Constant? Tighter Rates for Local SGD with Bounded Second-order Heterogeneity

この研究では、分散最適化アルゴリズムの効率化を目的に、新しい評価方法を提案しました。この方法は、局所のSGDの効率を分析し、実際のデータヘテロgeneityを考慮することで、分散最適化の効率を向上させました。

深層学習正規化・最適化手法

用途: 分散最適化の効率化
難易度: Hard
コスト: Low

arxivPaper only2026-07-16

Precise sample covariance spectral norm error -- an RDT view

この研究では、サンプル協方差行列の精度を向上させる方法を検討しました。特に、サンプルサイズが小さく、収集されたデータの特性から、正解率の期待値は小さい場合に、問題が最も発生しやすくなる可能性があります。この研究では、正解

コンピュータビジョンセグメンテーションテキスト

用途: サンプル协方差行列の精度を向上させる
難易度: Hard
コスト: Medium

arxivPaper only2026-07-14

Sharp Optimal Algorithm for Derivative-Free Stochastic Convex Optimization in One Dimension

Stochastic convex optimization is a classical problem with well-understood guarantees under first-order feedba

深層学習軽量化・量子化

用途: 1次元の非連続的なconvex関数の最適化を目的とする。
難易度: Hard
コスト: Medium

arxivPaper only2026-07-14

A new dual-population constrained multi-objective evolutionary optimization algorithm with repair constraint handling for structural optimization

構造オプティミゼーション問題は、決定変数が多数、かつ非凸の可行域を持つため、Pareto前景に到達するには多数の関数評価が必要とします。そのため、高性能で効率的なオプティミゼーションアルゴリズムが必要になっています。この

条件最適化深層学習軽量化・量子化

用途: 構造オプティミゼーション問題の効率的な解決方法
難易度: Hard
コスト: Medium

arxivPaper only2026-07-14

Quiz Show Games: Searching with Bimodal Hiding

資格試験で正解するかどうかを決定するために、受験者に質問を順番に提示し、正解すると賞品がもらえるクイズゲームを想定し、その順番を最適化する問題を解いた。

センサ/時系列機械学習時系列

用途: 資格判定
難易度: Hard
コスト: Medium

arxivPaper only2026-07-13

Long-Memory Reservoir Computing for Data-Scarce Dengue Forecasting

大型言語モデル(LLM)は最近急速に普及していますが、その推論に際してはAI加速器が必要になります。トークンフェーズはLSTMなどのニューラルネットワークで処理される分野ですが、現在AI加速器におけるこの分野の効率を向上

センサ/時系列深層学習RNN / LSTM回帰予測時系列

用途: AI加速器でのLLMトークンフェーズを最適化する
難易度: Hard
コスト: High

arxivPaper only2026-07-06

A Large-Scale Sparse Multiobjective Optimization Algorithm Based on Optimal Performance Scores

この論文では、大規模スパース多目標最適化の問題に取り組むために、新しく提唱された適応可能な初期値生成アルゴリズムを提案し、アルゴリズムの効率とパフォーマンスを評価する。

品質予測/異常検知コンピュータビジョンセグメンテーション生成

用途: 大規模スパース多目標最適化
難易度: Hard
コスト: Medium

arxivPaper only2026-07-06

Strategic Buying Agents

オンライン購入の最適化を目的とするストラテジックビーイングアージェントフレームワークを発表する。

コンピュータビジョンセグメンテーションテキスト

用途: オンライン購入の最適化
難易度: Hard
コスト: Medium

arxivPaper only2026-07-02

Hybridizing a Grouping Metaheuristic with Reinforcement Learning for the One-Dimensional Bin Packing Problem

1D バイナリングパッキング問題（1D-BPP）とは、さまざまな用途に多く応用される、分配不可能なNP困難な組合せ最適化問題である。この研究では、Falkenauerのハイブリッドグループゲンエイリアスアリファメント（

表形式向き品質予測/異常検知自然言語処理RAG生成表形式強化学習

用途: 1D バイナリングパッキング
難易度: Hard
コスト: Low

arxivPaper only2026-07-01

MMAO-Cls: Metabolic Multi-Agent Optimization for Joint Feature Selection and Classifier Tuning

マルチアジェント最適化を使用して、クラスター選択とモデル調整のためのMMAOクラスの実現を提案しました。

表形式向きコンピュータビジョンセグメンテーション分類表形式

用途: クラスター選択とモデル調整のためのメタボリックマルチアジェント最適化
難易度: Hard
コスト: Low

arxivPaper only2026-07-01

MMAO-Dyn: A Metabolic Multi-Agent Optimizer for Dynamic Optimization

この研究では、メタボリックマルチエージェント最適化 (MMAO) が動的最適化に適用できるようにする必要がありました。MMAO-Dyn は、環境の変化によって元の有効な局所的構造を無効にした非stationary な設

強化学習マルチエージェントテキスト

用途: 動的最適化
難易度: Hard
コスト: Medium

arxivPaper only2026-07-01

From Consistency to Collaborative Discovery: MFEA-CoD for Multitask Novelty Search

この研究では、多タスクの奇抜さを促進するために、エボリューション性の多タスク (EMT) を導入しました。EMT は、目標指向の最適化に焦点を当ててきましたが、共通性の構造を利用して、同時に複数の最適化問題を解決する能力

自然言語処理RAG生成

用途: 多タスクの奇抜さ検索
難易度: Hard
コスト: Low

arxivPaper only2026-06-30

A Large-Scale Empirical Evaluation of MMAO Under Fair-Budget Continuous and Discrete Benchmarks

この研究では、多様なベンチマークを用いて、Metabolic Multi-Agent Optimizer (MMAO)の適切性を評価します。MMAOは、複数エージェント間でリソースを分配するための閉ループのシステムです。

強化学習モデルフリー (DQN / SAC)

用途: 適切な方法を用いてリソース分配を最適化する
難易度: Hard
コスト: Medium

arxivPaper only2026-06-29

Partition-Guided Distance Saliency: Bridging Decision and Objective Spaces in Many-Objective Optimization

この論文では、多目的最適化の解釈を向上させるために用いる Partition-Guided Distance Saliency (PGDS) アルゴリズムを提案しました。これにより、多目的最適化の解釈の向上に役立つものと

説明可能MLOpsパイプライン構築画像

用途: 多目的最適化の解釈の向上
難易度: Hard
コスト: Medium

arxivPaper only2026-06-26

DE-2LS: Differential Evolution with Lightweight Late Local Search for Constrained Numerical Optimization

可算推定に適した制約付き一つの目標関数の最適化に適したアルゴリズムDE-2LSが紹介されます。

深層学習軽量化・量子化

用途: 可算推定に適した制約付き一つの目標関数の最適化アルゴリズムの開発
難易度: Hard
コスト: Medium

arxivPaper only2026-06-26

DE-2LS: Differential Evolution with Late-Stage local-search for Unconstrained Single-Objective Numerical Optimization

可算推定に適した一つの目標関数の最適化アルゴリズムとして、DE-2LSが紹介されます。

品質予測/異常検知深層学習軽量化・量子化

用途: 可算推定に適した一つの目標関数の最適化アルゴリズムの開発
難易度: Hard
コスト: Medium

arxivPaper only2026-06-25

Random Walk on Bézier Curves for Global Optimization

この研究では、全域最適化アルゴリズムを開発しました。研究者は、Bézier カーブに基づく随伴的トレース検索というアルゴリズムを提案しました。

説明可能自然言語処理RAG

用途: 全域最適化アルゴリズムの開発
難易度: Hard
コスト: Low

arxivPaper only2026-06-25

Three-Objective Integral R2 Subset Selection: NP-Hardness and Submodular Approximation

この研究では、多目標最適化法の分析をしました。これは、システムによって最適解が幾つか存在する状況を考慮することで、最適解を探索するために行われた。

数学・理論最適化

用途: 多目標最適化法の分析
難易度: Hard
コスト: Medium

arxivGitHubあり2026-06-18

Weight Adaptation for Improving Parallel Performance of Adaptive Stochastic Natural Gradient

概率モデルに基づく進化アルゴリズムは、暗号化された最適化において強力なツールである。特に、ASNGは、重力を適応させることで、効率的かつ安定した最適化を実現している。しかし、重量の制御は依然として未解明の一つの分野である

条件最適化深層学習軽量化・量子化

用途: 強力な並行化のための重み適応
難易度: Easy
コスト: Medium

arxivPaper only2026-06-16

Dimensionality Controls When Modularity Helps in Continual Learning

次元制御とモジュラリティの関係を研究することで、続き続ける学習において、安定性と変化性を最適化し、より効率的な学習を行うことが可能となる。

説明可能深層学習RNN / LSTM

用途: 次元制御とモジュラリティの関係
難易度: Hard
コスト: Medium

arxivPaper only2026-06-15

Effects of Objective Normalization on Regions of Interest in Preference-Based Evolutionary Multi-Objective Optimization

多オブジェクトの最適化における偏差修正の効果を分析し、偏差を削減するための方法を提案した。

条件最適化数学・理論最適化テキスト

用途: 多オブジェクトの最適化における偏差修正の効果
難易度: Hard
コスト: Medium