MLinfo | 機械学習・AI論文まとめ

Phylogenetic signal in marine mammal and bird vocalizations captured by audio foundation models: the limited benefit of domain-specific pretraining

Do learned audio embeddings encode structure that nobody told them to encode? We probe four large pretrained a

センサ/時系列自然言語処理埋め込み・検索分類音声

用途: 分類
難易度: Hard
コスト: High

On the Identifiability of Controlled World Models

Learning world models that infer environment dynamics from high-dimensional observations and predict outcomes

自然言語処理RAG画像

用途: 技術検証・論文読解補助
難易度: Hard
コスト: Low

Reflector: Arrangement-Aware Harmonic Retrieval for Sample-Based Composition

Sample retrieval tools can help composers find harmonically compatible material, but querying from a fixed ref

MI向き自然言語処理埋め込み・検索テキスト音声

用途: 技術検証・論文読解補助
難易度: Hard
コスト: High

少数データ向きセンサ/時系列深層学習軽量化・量子化分類回帰マルチモーダル

LunarFM: A Shared Multimodal Representation of the Moon's Surface

The renewed global focus on lunar exploration, driven by the prospect of in-situ resource utilization and a su

用途: 分類
難易度: Hard
コスト: High

Universal BCI Personalization: One API for Frozen EEG Trunks and Foundation Models

Frozen EEG encoders proliferate; per-model fine-tune defaults do not scale. We present Nimbus Personalizer: on

自然言語処理ファインチューニング

用途: バイオメトリック入力で意思決定システムのパーソナライズ
難易度: Hard
コスト: Low

IQ-JEPA: A Joint-Embedding Predictive Architecture with a Hermitian Vision Transformer for Sound Speed and Attenuation Estimation from Ultrasound IQ Data

Frozen EEGのエンコードを使用し、Frozen TrunkとFoundation Modelを統合することにより、システムのパーソナライズを実現します。

深層学習Transformerテキスト音声

用途: 技術検証・論文読解補助
難易度: Hard
コスト: High

Unbiased Open World Regularization for Fair Self-Supervised Learning

この論文では、セルフスーパーバイス学習の公平性を達成するために、Unbiased Open World Regularizationを提案する。この方法は、学習された表現を歪曲するbiasを排除

自然言語処理埋め込み・検索分類教師あり自己教師

用途: セルフスーパーバイズ学習の公平性
難易度: Hard
コスト: Low

Reasoning Denoiser: Denoising Reasoning Traces for Hallucination Detection in Large Reasoning Models

Large reasoning models (LRMs) generate long reasoning traces before producing final answers. While these trace

自然言語処理RAG検出

用途: 検出
難易度: Hard
コスト: Low

Rethinking Multi-Branch and Cross-Backbone Fusion for Vehicle Re-Identification in the Foundation-Model Era

Multi-branch architectures and CNN-Transformer fusion have long been regarded as effective ways to improve veh

深層学習Transformer画像

用途: 技術検証・論文読解補助
難易度: Hard
コスト: High

説明可能深層学習Transformer検出回帰画像

DCS: A Unified Conditional Sensitivity Framework for Cross-Modal Copyright Infringement Detection

画像コピーライト侵害検-outのために、新しい統合された検出フレームワークを開発した。このフレームワークは、侵害の有力性を特性の変化として視覚化し、侵害判定のためにコピーライトの保護されたターゲットの条件付き分布シフトを

用途: コピーライト侵害検-out のための特性識別
難易度: Hard
コスト: High

LatentFlow: Visual Analytics for Latent Space Analysis in Molecular Graph Neural Networks

Chemists and materials scientists increasingly use machine learning models, such as graph neural networks (GNN

MI向き深層学習グラフニューラルネット画像

用途: 技術検証・論文読解補助
難易度: Hard
コスト: High

説明可能センサ/時系列深層学習Transformer分類異常検知埋め込み

PRIMS: Physics-guided Representation for Fluid Identification in Multimodal Sensing

液体の識別は、ミクロ流動の応用に不可欠であり、しかし、流況、圧力、温度を取り巻く条件が変化することで、信頼性が失われるのである。この研究では、物質の物理的関係を考慮し、視覚的シグナルを結合することで、物質を識別するための

用途: 物質の識別
難易度: Hard
コスト: High

dRAE: Representation Autoencoder with Hyper-Spherical Codes

この研究では、可視表現の量化を支援する超球形コードを提案し、高次元空間における可視表現を簡潔に表現する機能があることを明らかにしました。

深層学習軽量化・量子化生成画像テキスト

用途: 可視表現の量化を支援する超球形コード
難易度: Hard
コスト: High

センサ/時系列深層学習軽量化・量子化QAテキスト音声

MEUSLI: a Multilingual Projector for LLM-based ASR and Beyond

この研究では、マルチリンガル映像認識を支援するプロジェクターを提案し、マルチリンガル

用途: マルチリンガル映像認識を支援するプロジェクター
難易度: Hard
コスト: High

品質予測/異常検知深層学習Transformer生成

Nanbeige4.2-3B: Unlocking Agentic Capabilities in a Compact Mode

We present Nanbeige4.2-3B, a compact general agentic model with 3B non-embedding parameters. It delivers stron

用途: 生成
難易度: Hard
コスト: High

TextSLIP: Text Self-Supervised CLIP for Medical Report Generation

ラジオリジー報告の自動化は、報告の連続性と臨床ワークフローを改善するために重要です。 CLIPは、医学分野の視覚言語モデリングを進歩させましたが、既存のCLIPスタイルアプローチでは、複雑な報告生成において十分なfine

自然言語処理ファインチューニング生成埋め込み画像

用途: medical Report Generation
難易度: Hard
コスト: High

表形式向きセンサ/時系列自然言語処理埋め込み・検索検出生成画像

ISPCloak: Weaponizing ISP for Optimization-Free Physical Camouflage against Deepfake Detectors

The rapid advancement of generative models has spurred the critical need to evaluate the worst-case robustness

用途: 検出
難易度: Hard
コスト: Low

Three-Body Alignment: Aligning Chess Agent with Human Reasoning through Reranked Rationale

人間の推論とマシン・リーザーの推論を一致させることがAIセキュリティーやセーフティーにおける課題です。人間の推論とマシンの推論を対称化することで、AIシステムを安全かつ予測可能なものとすることができます。

説明可能深層学習軽量化・量子化検索画像テキスト

用途: 人間の推論とマシン・リーザーの推論の対称化
難易度: Hard
コスト: High

Quantifying Political Partisanship for Cross-Platform Analyses

複数のプラットフォームにおける政治的偏見の測定を提唱し、プラットフォームをまたいだ政治的偏見の統一的な測定方法を開発します。

深層学習Transformer異常検知テキスト

用途: 複数のプラットフォームにおける政治的偏見の測定
難易度: Hard
コスト: Low

Data eccentricity, asymptotics of Gaussian RBF reproducing kernel Hilbert space, and kernel PCA

分布的ガウスRBFのRPKHSを統計的に解釈し、ガウスRBFのRBFの統計的解釈を

品質予測/異常検知深層学習Transformer

用途: ガウスRBFのRPKHSの統計的解釈
難易度: Hard
コスト: Low

Relaxed activation analysis of dataflow networks - A clock calculus for machine learning and real-time scheduling

Previous work has shown that the simple dataflow primitives of the Lustre language allow the natural, semantic

深層学習RNN / LSTM

用途: 技術検証・論文読解補助
難易度: Hard
コスト: High

表形式向きCPUで試しやすいセンサ/時系列自然言語処理RAG分類検出予測

From Seasonality to Semantics: Benchmarking a Hybrid Probabilistic Forecasting System for Roadblocks in Bolivia

Roadblocks in Bolivia are a social conflict phenomenon with devastating economic impacts, estimated at losses

用途: 分類
難易度: Hard
コスト: Low

Graph Learning on Ensembles of Cyclic Peptides: An Investigation of Molecular Ensemble Modeling

分子設計技術のための新しいアプローチであるEnsembleEGNN（Equivariant Graph Neural Network）を提案しました。EnsembleEGNNは、共役グラフニューラルネットワークを使用して

深層学習Transformer自己教師

用途: 分子設計技術の開発
難易度: Hard
コスト: High

センサ/時系列自然言語処理大規模言語モデル分類検出埋め込み

Toward Generalizable Cognitive Impairment Detection with Speech-Based Multimodal Large Language Models

認知機能障害（CI）は重大な公衆衛生上の懸念となっている。早期発見と精度の高い診断は、適切な介入と患者結果の向上に不可欠である。この研究では、スピーチベースのCI検出が有望な非侵襲的アプローチであることを示唆している。最

用途: 認知機能障害の早期発見のためのスピーチベースのマルチモーダル大規模言語モデル
難易度: Hard
コスト: High

Compact Latent Coordination for Autonomous Vehicles at Unsignalized Intersections

自律車は人間の協調を必要としますが、交通信号機のない交差点では協調が困難です。この研究では、複数の自律車を操作するための新しいアプローチが提案されていて、Master-AgentProto-planSystem（MAPS

自然言語処理RAG強化学習

用途: 交通信号機のない交差点のコミュニティでの自律車の協調
難易度: Hard
コスト: Low

M$^3$-Gen: Interpretable Multimodal Generation of Gene Expression Profiles Using Clinical and Imaging Data

この研究では、臨床データと画像データを用い、臓器の遺伝子発現プロファイルを予測することができます。提唱されるM^3-Genフレームワークは、生成的アジバーサリアルネットワークを用い、臨床データと画像データを組み合わせた方

説明可能自然言語処理RAG生成画像マルチモーダル

用途: 臓器の遺伝子発現プロファイルの予測問題
難易度: Hard
コスト: High

Counterfactual Explainability Framework With CycleGAN And Counterfactual-Classifier Alignnment Score for Retinal Disease Classification

ロシア語で構築されたベンチマーク、RUMBAは、LLMの長期的なメモリをテストするために開発されました。このベンチマークでは、長期的なメモリを使用する質問のタイプや、ロシア語のテキスト内のメモリと時間に関する情報を考慮し

説明可能深層学習CNN分類検出画像

用途: ロシア語のロングメモリをテストする
難易度: Hard
コスト: High

ToolGuardian: Declarative Security for AI Agent-Tool Interactions

LLM agents increasingly rely on external tools, expanding capability while creating a new security boundary: t

MI向き自然言語処理大規模言語モデルテキスト

用途: 技術検証・論文読解補助
難易度: Hard
コスト: High

MosaicJoin: Compact Semantic Sketches for Value-Level Join Discovery

Join discovery is a core task in dataset search, enabling users to find columns that can be joined with a give

深層学習軽量化・量子化

用途: 技術検証・論文読解補助
難易度: Hard
コスト: High

コンピュータビジョンセグメンテーション埋め込みテキスト自己教師

MSBraM: A Multi-scale Self-supervised Brain Foundation Model for Hierarchical EEG Dynamics Learning

脳波データを用いたアプリケーションに必要な自律性を持たせた新しいEEGバックボーンモデルの提案であり、そのようなモデルは、EEG特性を理解する上で大きな助けとなるように期待されている。

用途: EEGデータの理解
難易度: Hard
コスト: High

説明可能深層学習Transformer検出埋め込みテキスト

Multimodal Pretraining for Generalizable EEG Representation Learning

組織内の脳波データを用いた

用途: EEGデータの理解と分析
難易度: Hard
コスト: High

arxivGitHubあり2026-07-23

DINOde: Continuous Vision-Text Alignment for Open-Vocabulary Semantic Segmentation

オープン語彙セマンティックセグメンテーションは、前もって定義されたカテゴリ以外のオブジェクトを分類する手法の一種である。本研究では、大規모言語モデルでこの手法を実現するために、連続的な視覚テキストのアライメントを実現する

自然言語処理RAGセグメンテーション画像テキスト

用途: オープン語彙セマンティックセグメンテーションのための視覚テキストの連続的なアライメントを実現する。
難易度: Hard
コスト: High

A Comparative Evaluation of Embeddings and LLMs in a Greek Book Publisher Setting - The CUP Dataset

この研究では、大規模言語モデルを活用して、Greekに基づく書籍検索システムの評価を行いました。大規模言語モデルを活用することで、検索精度が高まりました。

深層学習Transformer要約

用途: 書籍検索システムの評価
難易度: Hard
コスト: High

Word meaning co-determines vowel-inherent spectral change. A corpus-based investigation of conversational Mandarin

この論文では、会話マンダリンにおける単語の意味と子音の特性の関係を調べました。その結果、単語の

自然言語処理埋め込み・検索テキスト音声

用途: 会話マンダリンにおける単語の意味と子音特性の関係
難易度: Hard
コスト: Low

Progressive Cramming: Reliable Token Compression and What It Reveals

この研究では、トークン圧縮における進化的圧縮を提案し、トークン圧縮における進化的圧縮の効率的で高精度な解決策を提供した。

自然言語処理埋め込み・検索生成テキスト

用途: トークン圧縮
難易度: Hard
コスト: Low

Self-Supervised Learning of Structured Dynamics from Videos

ビデオ内のキャメラの動きと物体の動きを切り離すことで、モーションの表現学習を改善した。

深層学習Transformer埋め込み画像動画

用途: ビデオ内の動きの予測
難易度: Hard
コスト: High

Learning-based Seam Correspondence Reconstruction in Sewing Patterns

この研究では、現状では手動で行われている衣類制作パターンのデータから3Dモデルを自動生成することを目的として、グラフベースの学習フレームワークを提案している。このフレームワークは、衣類パターンを表すグラフを学習によって構

深層学習Transformerテキスト3D

用途: 衣服デザインの革新
難易度: Hard
コスト: High

Out of Sight, Still in Mind: Token Compression for Omni-LLMs

この研究では、大規模なオムニモダル言語モデル（Omni-LLMs）へのデータコンプレッションを目的として、オムニ-LLMsのトークンコストの増大を緩和するフレームワーク、ReMoの提案している。ReMoは、オムニ-LLM

自然言語処理大規模言語モデル画像テキスト音声

用途: 大規模な言語モデルへのデータコンプレッション
難易度: Hard
コスト: High

品質予測/異常検知自然言語処理埋め込み・検索生成3D

Hash-QNeRF: Multiresolution Hash Encoding for Quantum Neural Radiance Fields

Neural Radiance Fields (NeRF) have revolutionized novel view synthesis, yet their classical implementations re

用途: 生成
難易度: Hard
コスト: High

自然言語処理プロンプトエンジニアリング分類画像テキスト

Sparse Concept Channels in Frozen 3D CT Vision Encoders

Large Vision-Language Modelを用いてスパーズ概念チャンネルの学習を行い、高精度な radiological finding を実現する。

用途: スパーズ概念チャンネルの学習
難易度: Hard
コスト: High

説明可能深層学習Transformer埋め込み画像動画

HyWorldVLA: A Vision-Language-Action Model with Hybrid World Modeling for Autonomous Driving

可視化言語アクションモデルを用いてWorldモデリングを実現し、大規模なアウトドアシミュレーションで役立てる。

用途: 可視化言語アクションモデルにおけるWorldモデリング
難易度: Hard
コスト: High

Distribution-Alignment Bridge for Uncertainty-Aware Text-to-Video Retrieval

本論文では、テキストと動画を対応させるDistribution-Alignment Bridge（DAB）を提案します。DABは、テキストと動画のエンティティを確率分布として表現し、両者の間の分布の差異を解決します。この

自然言語処理埋め込み・検索生成テキスト動画

用途: テキストから動画の検索
難易度: Hard
コスト: High

MI向き品質予測/異常検知深層学習Transformer分類画像テキスト

Sidewalk Moments: Are Richer Representations Always More Human-Aligned? Evidence from City-Walk Videos

この研究では、都市ウォークビデオを分析するために、4つのモダリティの表現（スペース時領域情報、時間平均画像、オーディオ符号化、テキストベースの表現）を使用しました。

用途: 都市ウォークビデオの分析
難易度: Hard
コスト: High

Directional Kernel Mean Difference: A Fast Signed Statistic for Univariate Distribution Comparison

分布の比較を扱う研究、Directional Kernel Mean Difference を用いて分布の比較を提案する。

自然言語処理埋め込み・検索

用途: 分布の比較
難易度: Hard
コスト: Low

Efficient Clustering with Provable Guardrails for LLM Inference at Scale

LLMのインフェランス効率化を目的としたクラスタリングアルゴリズムが提唱される。このアルゴリズムは、各サンプルにクォリティコントロールを実行する能力を備えていると主張し、プローブメトリクスとパフォーマンスメトリクスを組み

品質予測/異常検知深層学習軽量化・量子化

用途: LLMのインフェランス効率化
難易度: Hard
コスト: High

arxivGitHubあり2026-07-22

LKValues: Aligning Large Language Models with Sri Lankan Societal Values

スリランカの文化的価値観が反映された言語モデルの開発により、同国で言語モデルを使用する際の精度を向上させることができると予想され、このような言語モデルを開発するためのリソースを提供します。

自然言語処理大規模言語モデルテキスト

用途: スリランカの文化的価値を対象とする言語モデルの精度向上
難易度: Hard
コスト: High

PyroDash: Cost-Efficient Token-Level Small-Large Language Model Collaborative Inference

危険な問題に対する正しい答えを提供する大きな言語モデルと費用の効率が良い、小さな言語モデルを協力させる技術が開発されました。

深層学習軽量化・量子化生成テキスト

用途: 小さな言語モデルを大きい言語モデルと協力させる手法が効率的かつ安全に実装される
難易度: Hard
コスト: High

MI向き自然言語処理大規模言語モデル生成画像テキスト

Back to Back with a Copy: A Computational Analysis of AI-Generated Visual Contemporary Art Pastiches

AIは、特に当代芸術作品のパスティーシュを作成する能力が高いが、これらの作品はどれだけ実際の作品と似ているかを調べました。

用途: AI生成された芸術作品と原画との相似性を調べる
難易度: Hard
コスト: High

Language-Specific versus Cross-Lingual Knowledge Graphs for Implicit Aspect Identification in Arabic: A Comparative Study of Reasoning and Adaptation Strategies

アラビアsentiment分析には、文章中で明示的に述べられていないアスペクトを抽出する機能が必要です。これは、オプションの言語モデルにアッセメントグラフを使用して実現できますが、低リソース言語であるアラビア語では、この

自然言語処理大規模言語モデル生成テキスト

用途: Arabiasentiment分析
難易度: Hard
コスト: High

arxivGitHubあり2026-07-22

emb-diversity: A Tool for Embedding-Based Measurement of Data Diversity

データ多様性はフェアかつ頑健なNLPモデルを構築する上で重要な要素である。しかし、データ多様性を測定する現存のアプローチは不合理で一貫性が欠けている。そのため、エンドポイントベースの多様性測定ツールを提案した。

自然言語処理RAGテキスト

用途: データの多様性の測定
難易度: Easy
コスト: Low

DS@GT ARC at ImageCLEFmed GANs 2026: Geometric Filtering for Privacy-Preserving CT Slice Generation

この研究では、画像CLEFmed GANs 2026のイベントで利用可能なプライバシープリザーブCTスラ이스生成にフォーカス。開発されたアプローチは最適な輸送条件フローマッチングとプライバシーの考慮を含むトレーニング、お

自然言語処理埋め込み・検索生成画像

用途: 医学画像処理
難易度: Hard
コスト: High

ODeform: Learning Continuous 4D Motion for Shape Deformation with Neural ODEs

オブジェクトの形状変形をモデル化するためのNeural ODEを提案し、計算速度が向上したり、リアルタイムアプリケーションに対応したりすることを目指しています。

自然言語処理埋め込み・検索3D

用途: オブジェクトの形状変形をモデル化する
難易度: Hard
コスト: High

自然言語処理大規模言語モデル画像テキストマルチモーダル

Diverse-Intent Multi-Turn Fashion Image Retrieval

複数ターンのファッション画像検索は、実世界のファッション検索では重要なタスクです。Diverse-Intent Multi-Turn Fashion Image Retrievalアルゴリズムは、異なる検索用途を扱うこと

用途: 複数ターンのファッション画像検索
難易度: Hard
コスト: High

センサ/時系列深層学習軽量化・量子化検出セグメンテーション埋め込み

arxivGitHubあり2026-07-22

Not All Patches are Equal: Sampling Matters for Visible-Infrared Pre-Training

可視光と非可視光のデータを連携するためのアプローチを提案し、可視光と非可視光のデータを連携するための精度と効率を向上させることを目指しています。

用途: 可視光と非可視光のデータを連携するためのアプローチ
難易度: Hard
コスト: High

arxivPaper only2026-07-21

Supra Cognitive Modes: A Routed Architecture for Agent Memory

この研究では、エージェントメモリーのワークロードは直接的事実検索、関係連鎖や現在の状態の推論、長時間の履歴上に関係がある合成を組み合わせて、Supra Cognitive Modes を開発しました。このアーキテクチャで

品質予測/異常検知自然言語処理埋め込み・検索分類生成

用途: メモリアーキテクチャの設計
難易度: Hard
コスト: Low

arxivPaper only2026-07-21

AILQA: Evaluating AI-Driven Legal Question Answering Systems for the Indian Legal System

This comprehensive study introduces an advanced Artificial Intelligence for Indian Legal Question Answering (A

品質予測/異常検知自然言語処理大規模言語モデル生成QAテキスト

用途: 生成
難易度: Hard
コスト: High

arxivPaper only2026-07-21

RF-Agent: A Practical Framework for Building Language Agents for RFIC Design

Large language models (LLMs) have driven rapid progress in electronic design automation (EDA), yet their appli

深層学習軽量化・量子化生成テキスト

用途: 生成
難易度: Hard
コスト: High

Vector Search As Nearest Neighbor Matching: RAG-based Policy Learning in Causal Inference

因果推論を用いた政策学習を提案し、政策選択を行う際に最も近い類似の証拠によって行動の有効性を評価することを目指している。

深層学習Transformer生成

用途: 因果推論の政策学習
難易度: Hard
コスト: Low

Scalable and Efficient Joint Spiking Embedding Predictive Architecture for Large-Scale Dynamic Graphs

動的グラフの構造と意味のパターンを捉えるため、最新の研究では、ラベル付けされたデータの欠如に対応するために、生成的または対比的のパラダイムを導入する。ただし、これらの方法は複雑なエッジレベルからの再構築の目標に依存し、グ

深層学習軽量化・量子化分類検出生成

用途: 多階層グラフに対する埋め込み予測アーキテクチャ
難易度: Hard
コスト: High

深層学習Transformer埋め込み画像テキスト

Patch Policy: Efficient Embodied Control via Dense Visual Representations

ロボット制御を効率化するために、パッチを用いた政策学習を提案し、密集された視覺表現を用いて実装することを目的としている。

用途: リソース制限のあるロボットの制御
難易度: Hard
コスト: High

HCPG-Flow:Hierarchical Contact-Progress Guidance for Flow-Policy Robot Manipulation

Flow policies can represent multimodal action distributions for robot manipulation, yet a robot must execute o

自然言語処理埋め込み・検索マルチモーダル

用途: 技術検証・論文読解補助
難易度: Hard
コスト: High

センサ/時系列自然言語処理埋め込み・検索画像マルチモーダル

COLIP-2: Olfaction-Vision-Language Embeddings

The Contrastive Olfaction-Language-Image Pre-training 2 (COLIP-2) model is a multimodal embeddings space that

用途: 技術検証・論文読解補助
難易度: Hard
コスト: High

arxivPaper only2026-07-19

Kernelized Linear Attention: Breaking the Capacity Wall with Symmetric Cones

Linear attention promises constant-time recurrent inference but degrades sharply on associative recall. We for

深層学習RNN / LSTM異常検知

用途: 異常検知
難易度: Hard
コスト: High

arxivPaper only2026-07-19

Econometrics with Pre-Trained Embeddings for Unstructured Data

Unstructured data, such as images and text, are increasingly used in empirical economics. Since training machi

表形式向き品質予測/異常検知自然言語処理RAG回帰画像テキスト

用途: 回帰
難易度: Hard
コスト: High

arxivPaper only2026-07-18

How to Build Marcus's Algebraic Mind: From Thagard's Brain--Mind Viewpoint

Two critiques of connectionist cognition converge on one missing capacity. In The Algebraic Mind, Marcus isola

自然言語処理大規模言語モデル

用途: 技術検証・論文読解補助
難易度: Hard
コスト: High

arxivPaper only2026-07-17

Constrained Hebbian Learning Supports Efficient Representational Allocation under Structural Constraints

脳のニューロン同士のつながりを分析する方法を提案する。この方法では、神経伝達の構造を考慮しながら、ニューロン間のつながりを分析できる。

深層学習Transformer分類画像音声

用途: 神経伝達の分析
難易度: Hard
コスト: Low

arxivPaper only2026-07-16

cGAP: Generalized Association Plots with HOMALS-Guided Heatmaps for Visualization of High-Dimensional Categorical Data

高次元カテゴリデータを可視化するため、hierarchical optimizing linear assignment (HOMALS)を使用し、可視化に役立つ関連表

説明可能自然言語処理ファインチューニング分類画像

用途: 高次元カテゴリデータの可視化
難易度: Hard
コスト: Low

arxivPaper only2026-07-15

DAGR: State-Conditioned Goal Representations via Difference-Aware Goal Cross-Attention

この研究では、目標が現在の状況に依存するゴール表現を確立します。研究者は、目標の静的表現をステート条件表現に更新することで、現在の状況に応じて目標を修正します。

深層学習Attention機構強化学習

用途: ステートコンディショナルゴール表現
難易度: Hard
コスト: Low

arxivPaper only2026-07-12

Sticky Jump Diffusions: A Unifying View of Masked, Continuous, and Hybrid Diffusion

We introduce Sticky Jump Diffusions (SJDs), continuous-time Markov processes on $\mathbb R^d$ whose discrete a

自然言語処理埋め込み・検索分類テキスト

用途: 分類
難易度: Hard
コスト: High

arxivPaper only2026-07-11

Emergent Generalization by Representation Learning in Artificial Neural Networks

Dimensionality reduction has proven powerful for identifying neural manifolds, which are low-dimensional struc

説明可能センサ/時系列深層学習Transformer異常検知埋め込み時系列

用途: 異常検知
難易度: Hard
コスト: Low

arxivPaper only2026-07-10

Foveation-Guided Dynamic Token Selection for Robust and Efficient Vision Transformers

The human visual system (HVS) employs foveated sampling and eye movements to achieve efficient perception, con

深層学習Transformer画像

用途: 技術検証・論文読解補助
難易度: Hard
コスト: Low

arxivPaper only2026-07-08

Sampling on Random Subspaces under Limited Data in the Context of Exploratory Landscape Analysis

これは、Exploratory Landscape Analysisにおけるランダムサブスペースのサンプリングを使用するためのフレームワークであるSampling on Random Subspacesを提案している。

条件最適化自然言語処理ファインチューニングテキスト

用途: ランドスケープの分析
難易度: Hard
コスト: Low

arxivPaper only2026-07-07

A Gold-Standard Study of What Makes a Lightweight Game-Playing Agent Strong

これは、プレイヤーが勝つゲームの勝利条件の強制とパロディーを目的としています。カードプレーヤーのゲームで特に興味を持っています。

深層学習CNNテキスト強化学習

用途: パソコンゲームの勝利するアリソーの決定
難易度: Hard
コスト: High

arxivPaper only2026-07-07

Formalizing Scarf, Brouwer, and Nash in Lean

これはLeanの統合演算子に関する論文で、サーフの定理からブルワー定理までの論理的な導出を検討しています。

自然言語処理埋め込み・検索

用途: 統合演算子に関する論述
難易度: Hard
コスト: Low

arxivPaper only2026-07-06

QDEvo: A Multi-Objective Quality-Diversity Framework for Automated Heuristic Design

The integration of Large Language Models (LLMs) with evolutionary computation has emerged as a powerful paradi

品質予測/異常検知深層学習軽量化・量子化生成テキスト

用途: 生成
難易度: Hard
コスト: High

arxivPaper only2026-07-03

Rank-Order N-of-M Codes for Sparse Distributed Memory: Disentangling Representation and Learning Effects in Noise Robustness Against Contemporary Neuromorphic Architectures

Large language models remain limited as continual learning systems, motivating renewed interest in Sparse Dist

表形式向き自然言語処理大規模言語モデル埋め込みテキスト表形式

用途: 埋め込み
難易度: Hard
コスト: High

arxivPaper only2026-07-03

An Asymptotic Analysis of the Shapley Value for Dataset Valuation

We propose an asymptotic analysis of the Shapley value in a dataset valuation setting in which utilities are m

深層学習Transformer

用途: 技術検証・論文読解補助
難易度: Hard
コスト: Low

arxivGitHubあり2026-07-01

Towards Learning Representations of Policies in Two-Player Zero-Sum Imperfect-Information Games

このアプローチでは、ゼロサムゲームのポリシー表現学習を取り上げ、ポリシー表現を生成し、評価する方法を提案しています。

深層学習Transformer教師あり自己教師

用途: ゼロサムゲームのポリシー表現学習
難易度: Easy
コスト: Low

arxivPaper only2026-06-30

Diffusing Blame: Task-Dependent Credit Assignment in Biologically Plausible Dual-Stream Networks

Biological neural circuits obey Dale's principle: each neuron's synapses are uniformly excitatory or inhibitor

自然言語処理ファインチューニング分類埋め込み強化学習

用途: 分類
難易度: Hard
コスト: High

arxivPaper only2026-06-23

What Does a Pathological Speech Assessment Model Know about Acoustic Features? A Case Study on Oral and Oropharyngeal Cancer Patients

この研究では、パーソナライズされた話し言葉アシスタンスシステムを提案します。

説明可能センサ/時系列品質予測/異常検知深層学習軽量化・量子化音声

用途: パーソナライズされた話し言葉アシスタンスシステムの開発
難易度: Hard
コスト: Low

arxivPaper only2026-06-23

Distributed Quality-Diversity Search for Toxicity in Large Language Models

この研究では、多様性のあるトキシックテストを検索します。

品質予測/異常検知自然言語処理大規模言語モデル生成テキスト

用途: 多様性のあるトキシックテストの検索
難易度: Hard
コスト: High

arxivPaper only2026-06-18

Evolutionary Two-Stage Hyperparameter Optimization Strategies for Physics-Informed Neural Networks

物理学定理を使用したニューラルネットワークを提案。物理学定理をニューラルネットワークに組み込み、この定理を用いて機械学習を向上させる。

条件最適化深層学習Transformer

用途: 物理学定理を使用したニューラルネットワーク
難易度: Hard
コスト: High

arxivPaper only2026-06-18

Beyond Accuracy: Measuring Logical Compliance of Predictive Models

機械学習モデルを評価する手法を提案。既存の評価方法ではモデルが誤った結果を出してしまうため、これによりモデルが正確に評価できる。

品質予測/異常検知自然言語処理埋め込み・検索分類回帰

用途: 機械学習モデルを評価
難易度: Hard
コスト: High

arxivPaper only2026-06-18

Hybrid ANN-SNN Pipeline with Local Plasticity

神経網路の設計を目指す本研究では、ANNとSNNを組み合わせたハフマン式設計法

深層学習CNN分類画像

用途: 神経網路の設計
難易度: Hard
コスト: High

arxivPaper only2026-06-13

Controlled Dynamics Attractor Transformer

この研究では、Controlled Dynamics Attractor Transformer (CDAT)を提案しました。このTransformerは、Self-Attention MechanismとAssocia

説明可能品質予測/異常検知深層学習Transformer分類検出異常検知

用途: Controlled Dynamics Attractor Transformer (CDAT)を提案すること。
難易度: Hard
コスト: Low

arxivPaper only2026-06-12

Harnessing cortical geometry, wiring, and function as inductive biases for recurrent neural networks

How the wiring and functional organization of cortex shape recurrent computation remains a central question in

深層学習Transformer画像

用途: 技術検証・論文読解補助
難易度: Hard
コスト: Low