676 articles

Category

深層学習

Transformer、GNN、軽量化など、モデル実装や既存モデル改良に関係する深層学習技術を追います。

TransformerCNNRNN / LSTMグラフニューラルネットAttention機構正規化・最適化手法軽量化・量子化

人気記事

新着記事

未読 676
githubGitHubあり2026-06-09

transformers — 🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

🤗 Transformersは、テキスト・ビジョン・音声など複雑なモデル定義をサポートするフレームワークで、インフェレンスターやトレーニングに使用できる。

深層学習Transformer分類テキスト音声
用途
機械学習モデル定義
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

system_prompts_leaks — Extracted system prompts from Anthropic - Claude Fable 5, Opus 4.8, Claude Code, Claude Design. OpenAI - ChatGPT 5.5 Thinking, GPT 5.5 Instant, Codex. Google - Gemini 3.5 Flash, 3.1 Pro, Antigravity. xAI - Grok, Cursor, Copilot, VS Code, Perplexity, and more. Updated regularly.

本論文は、言語モデルの最適化に使用される Hyperparameter Transfer を量化するフレームワークを開発します。このフレームワーフークは、3 つのメトリックスを使用し、そのうちの 1 つは、hyperpa

説明可能深層学習Transformer生成
用途
言語モデルの最適化
難易度
Easy
コスト
Medium
githubGitHubあり2026-06-09

sglang — SGLang is a high-performance serving framework for large language models and multimodal models.

SGLangは、大規模言語モデルのサービングフレームワークです。このライブラリは、高性能なサービスフレームワークで、大規模言語モデルのサービングをサポートしています。

深層学習Transformer画像テキストマルチモーダル
用途
大規模言語モデルのサービングフレームワーク
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

OpenRLHF — An Easy-to-use, Scalable and High-performance Agentic RL Framework based on Ray (PPO & DAPO & REINFORCE++ & VLM & TIS & vLLM & Ray & Async RL)

OpenRLHFは、Ray上に構築された強化学習フレームワークです。このフレームワークは、PPO、DAPO、REINFORCE++など、様々な強化学習アルゴリズムをサポートしています。

深層学習Transformer画像
用途
強化学習フレームワーク
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

transformerlab-app — The open source research environment for AI researchers to seamlessly train, evaluate, and scale models from local hardware to GPU clusters.

kserveは、分散型生成的および予測性AI推論プラットフォームであり、可 scale, multi-framework デプロイをサポートして Kubernetes 上に展開されることができます。

深層学習Transformer
用途
AI研究者向けのオープンソース研究環境
難易度
Easy
コスト
Medium
githubGitHubあり2026-06-09

haystack — Open-source AI orchestration framework for building context-engineered, production-ready LLM applications. Design modular pipelines and agent workflows with explicit control over retrieval, routing, memory, and generation. Built for scalable agents, RAG, multimodal applications, semantic search, and conversational systems.

オープンソースのAIオーケストレーションフレームワークです。LLMアプリケーションの構築に必要なパイプラインやエージェントワークフローの設計ができるようになっています。

深層学習Transformer生成要約テキスト
用途
LLMアプリケーションの構築
難易度
Easy
コスト
High
arxivPaper only2026-06-08

Bandits for Efficient Experimentation: Adapting to Control Group, Preferences, and Context Drifts

この研究では、有効なバンドのオブザーバブックを設計しました。このオブザーバブックは、ユーザの相互作用とコンテキストの変化に応じて、有効バンドをアダプティブに選択することができます。

深層学習軽量化・量子化回帰テキスト
用途
有効なバンドのオブザーバブック
難易度
Hard
コスト
Medium
arxivPaper only2026-06-08

Zero Touch Predictive Orchestration: Automating Time-Series Models for the Cloud-Edge Continuum

この研究では、Zero-Touch自動化のために、時間系列モデルをトラッキングするための、機械学習ベースのアプローチを開発しました。このアプローチは、機器の唯一の出力を利用し、データを生成することができます。

センサ/時系列深層学習軽量化・量子化予測時系列
用途
_Zero-Touch時系列モデル自動化_
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Data Synthesis and Parameter-Efficient Fine-Tuning for Low-Resource NMT: A Case Study on Q'eqchi' Mayan

この研究では、低リソース言語NMTのために、データ合成方法を開発しました。これにより、データ合成されたコーパスを使用し、NMTモデルをパラメータ効率的にフィーヌチュン化できます。

深層学習軽量化・量子化生成翻訳テキスト
用途
NMT低リソースデータ合成
難易度
Hard
コスト
Medium
arxivPaper only2026-06-08

Integrating gene regulatory priors into Transformer attention with scTransformer for interpretable scRNA-seq analysis

scRNA-seq データの解釈を向上させる Transformer を提案。モデルにゲノム規制的情報を組み込むことで、遺伝子発現の解釈と予測の精度が向上することを示した。

説明可能深層学習Transformer分類教師あり自己教師
用途
scRNA-seq データの解釈を向上させる Transformer
難易度
Hard
コスト
High
arxivPaper only2026-06-08

LargeMonitor: Monitoring Online Task-Free Continual Learning via Large Pretrained Models

オンライン学習の継続学習では、モデルは非駅性データ ストリームから知識を継続的に蓄積する必要があります。モデルのパラメータはトレーニング中に効果的に調整される必要がありますが、パラメータ効率的なプロンプト チューニングや

深層学習軽量化・量子化検出テキストマルチモーダル
用途
オンライン学習の継続学習
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Reasoning Arena: Trace Tournaments When Verifiable Rewards Fall Short

この研究では、強化学習のトレーニングに使用するRewardsの検証が難しい場合は、Rewardがグループレベルでは無価値で、グループ間の優劣比較が不可能となる問題に対処するためのReasoning Arenaを提案します

品質予測/異常検知深層学習軽量化・量子化生成テキスト強化学習
用途
強化学習のトレーニング
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Multi-View Speech Representation Learning for Parkinson's Disease Detection Using Context-guided Cross-modal Attention

パーキンソン病(PD)の早期検出への取り組みとして、脳の損傷が発症前に生じる話術障害を分析するため、音声分析を用いてパーキンソン病の診断を提唱しています。

センサ/時系列深層学習Transformer検出生成埋め込み
用途
パーキンソン病の早期 検出
難易度
Hard
コスト
High
arxivPaper only2026-06-08

SNN-MLIR: An MLIR Dialect for Compiling Neuromorphic SNNs from NIR to Bare-Metal C

スパイクニューロンネットワーク (SNNs) は多くのフレームワーク(SnnTorch, Lava, Norse, など)で訓練されるが、各フレームワークごとにモデルのためのフォーマットがあるため、一貫した実行方法が見ら

CPUで試しやすい深層学習軽量化・量子化
用途
スパイクニューロンネットワークの実行
難易度
Hard
コスト
Low
arxivPaper only2026-06-08

Alcmean's: Unsupervised community detection using local Laplacian, automatic detection of the number of centers

Alcmean's アルゴリズムは、複雑なネットワークの分析において基本的な問題であるコミュニティ検出に取り組んでいます。従来のアルゴリズムはマニュアルなパラメータ調整を必要としており、中心の選択も不正確です。この課題を

深層学習グラフニューラルネット検出埋め込み教師なし
用途
コミュニティ検出問題
難易度
Hard
コスト
Low
arxivGitHubあり2026-06-08

Stabilizing On-Policy Distillation for MLLM Reasoning with Global Normalization

オンポリシーディストリレーションは、近年、重要なポストトレーニングの研究分野となりました。強い教師モデルを使用して学習トレッジを密に細かく指示することで、トピック認識を実現します。しかしなだな的にトークンレベルにおいてデ

深層学習軽量化・量子化マルチモーダル強化学習
用途
オンポリシーディストリレーション問題
難易度
Hard
コスト
High
arxivGitHubあり2026-06-08

Beyond FLOPs: Benchmarking Real Inference Acceleration of LLM Pruning under a GEMM-Centric Taxonomy

分析研究は、LLM推論速度を速めるため、トークン、レイヤー、ヘッド、次元、注意パターンの削減技術である削減技術を適用し、広範なパラダイムとして成長しています。削減方法の実装によって、実現された加速の度合いは、ハードウェア

品質予測/異常検知深層学習軽量化・量子化テキスト
用途
LLM推論加速問題
難易度
Hard
コスト
High
arxivPaper only2026-06-08

ATN3D: Density-Aware LiDAR-Radar Early 3D Object Detection Under Extreme Sparsity

自動運転車やインテリジェント輸送システムなどの自動化された車両の感知には3次元オブジェクト検出が必要です。道路での長距離検出は困難ですが、道路ではこの「長距離」に対する感知と決定の時間は約1-2秒です。2つの主な課題が現

センサ/時系列深層学習Transformer分類検出テキスト
用途
車のデッキの長距離認識に対する3次元オブジェクト検出
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Next-Token Prediction Learns Generalisable Representations of Sleep Physiology

基礎モデルは、多モーダル生理信号を人間の健康に縮小された表現に圧縮することで、睡眠医学、心臓学、神経学など、広い応用域への道を開いています。既存のモデルは、一般的にはマスクした再構築または対比的目的で訓練されています。

センサ/時系列深層学習Transformer分類埋め込み自己教師
用途
ngủの生理学的特性の学習
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Seeing the Hivemind: A Consensus-Aware Interaction Technique for Mitigating AI Homogenization

AIを用いた創作タスクに対する採用はますます広がる一方ですが、そのような用途を用いることにより、個々の創造性が当面で地元で低下し、スコープ上で創造性の多様性が減少します。そこで、我々は、コンピュータでシミュレートした検証

深層学習Transformer
用途
AIのホモジネーションの回避
難易度
Hard
コスト
Medium
arxivGitHubあり2026-06-08

TRL-Bench: Standardizing Cross-Paradigm Representation-Level Evaluation of Tabular Encoders

可勉強のターブルの信号に関する表現モデルが、異なるトレーニングパラダイムを持つモデルを評価しやすくする基準であるTRL-Benchを提案している。

表形式向き品質予測/異常検知深層学習軽量化・量子化埋め込みテキスト表形式
用途
可勉強のタブラー信号に対する表現モデルの評価基準を標準化する
難易度
Hard
コスト
High
arxivPaper only2026-06-08

MASS: Deep Research for Social Sciences with Memory-Augmented Social Simulation

Social Scienceにおける、Memory-Augmented Social Simulationを利用した深層学習を利用して、新しい研究方法を提案し、Social Scienceの研究実現を実現した

品質予測/異常検知深層学習Transformer生成テキスト
用途
Social Scienceにおける、Memory-Augmented Social Simulationを利用した深層学習を利用した研究の実現
難易度
Hard
コスト
High
arxivGitHubあり2026-06-08

An Enhanced Geometric-Spectral Feature Learning Framework for Airborne Multispectral Point Cloud Classification

空中マルチスペクトル点群(MPC)では、三次元空間とスペクトルの情報を組み合わせたデータが取得できるが、点群データの分類は難しい課題であったため、新しい学習フレームワークを 提案。

深層学習Transformer分類3D
用途
空中多スペクトル点群の分類
難易度
Hard
コスト
High
arxivPaper only2026-06-08

TLDR: Compressing Audio Tokens for Efficient Autoregressive Text-to-Speech

オーディオTokenと文書をモデル化するためにコーデックベースのARトークのジェネレーターが強力な文を音声の質を高めました。しかし、このアプローチでは、音声Tokenのシーケンスはテキストシーケンスより長くなるため、AR

品質予測/異常検知深層学習軽量化・量子化テキスト音声
用途
オーディオTokenの圧縮による話者ジェネレータの効率化
難易度
Hard
コスト
High
arxivPaper only2026-06-08

SpaceVLN: A Zero-Shot Vision-and-Language Navigation Agent with Online Spatial Cognitive Memory and Reasoning

Vision-and-Languageナビゲーションエージェントは、言語指示に従って環境を探索できる。Zero-shot Vision-and-Languageナビゲーションエージェントには、未知の環境における安全性と信

深層学習軽量化・量子化検出画像3D
用途
バイオインフォマティクスのための零-shot Vision-and-Languageナビゲーションエージェント
難易度
Hard
コスト
High
arxivGitHubあり2026-06-08

FAME: Forecastability-Aware Mixture of Experts for Heterogeneous Time Series Forecasting

この研究では、複数の時系列予測を合わせたモデルを使用して、個々の時系列の特性を考慮した予測を行うFAMEを提案します。このモデルは、個々の時系列の特性を考慮することで、より正確な予測が可能になります。

表形式向きCPUで試しやすいセンサ/時系列深層学習Transformer予測テキスト時系列
用途
多様な時系列予測
難易度
Easy
コスト
Low
arxivPaper only2026-06-08

PsychoSafe: Eliciting Psychologically-Informed Refusals in Large Language Models

この研究では、マルチモーダル言語モデルの評価のためのフレームワークを開発します。このフレームワークは、マルチモーダル言語モデルの生成性とコントロール性を評価することができます。

品質予測/異常検知深層学習軽量化・量子化テキスト
用途
マルチモーダル言語モデルの評価
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Overcoming Decoder Inconsistencies in Whisper for Dravidian and Low-Resource Languages

WhisperのようなマルチリンガルASRモデルの音声認識能力をDravidian言語で向上させるために、データセットと言語分析を用い、モデルをフィネチュアリングし、デコーダの不平衡を解消し、音声認識誤差を低減した。

センサ/時系列深層学習Transformerテキスト音声
用途
Dravidian言語の音声認識を改善する
難易度
Hard
コスト
Medium
githubGitHubあり2026-06-07

presidio — An open-source framework for detecting, redacting, masking, and anonymizing sensitive data (PII) across text, images, and structured data. Supports NLP, pattern matching, and customizable pipelines.

presidioは、テキスト、画像、構造化データを含む敏感データを検出、削除、マスク、アノニマイズするオープンソースフレームワークです。自然言語処理、パターンマッチング、カスタマイズ可能なパイプラインをサポートします。

表形式向き深層学習Transformer分類検出画像
用途
データのプライバシーを保護する
難易度
Easy
コスト
Low
githubGitHubあり2026-06-06

DiT-Extrapolation — Official implementation for "RIFLEx: A Free Lunch for Length Extrapolation in Video Diffusion Transformers" (ICML 2025) , UltraViCo (ICLR 2026) and UltraImage

分類問題では、多くの場合、ラベルは存在しないため、従来の学習アルゴリズムでは困難に感じられるが、In-Context Multiple Instance Learningという手法を使用することで、低ラベル環境で効率的に

深層学習Transformer生成画像動画
用途
多クラス分類タスク
難易度
Easy
コスト
High
arxivGitHubあり2026-06-05

RhinoVLA Technical Report

この論文では、VLAモデルをedgeハードウェアにデプロイするための手法を提案しています。この手法は、VLAモデルをedgeハードウェアにデプロイするためのフレームワークです。この手法は、edgeハードウェアを利用してV

深層学習軽量化・量子化画像テキストマルチモーダル
用途
VLAモデルをedgeハードウェアにデプロイするための手法
難易度
Hard
コスト
High
arxivPaper only2026-06-05

Does Appearance Help? A Systematic Study of Image-Based Re-Identification in Online 3D Multi-Pedestrian Tracking

3D Multi-Object Tracking (MOT)では、人の動きを検出し続けるために、3D点群データから3D人体の姿勢姿勢を推測する必要があり、主に幾何学情報に依存しているが、これは状況によっては人を分別するの

深層学習Transformer検出画像テキスト
用途
3D人間の追跡システムの外観の有用性
難易度
Hard
コスト
High
arxivPaper only2026-06-05

Neuro-Symbolic Learning for Long-Horizon Task Planning Under Complex Logical Constraints

タスクプランニングは複雑な論理制約の下でロボットが長い時間スケールのアクションシーケンスを決定する際、効率性の低下を伴い、近年のニューロ・シンボリックアプローチはオブジェクトの重要性スコアを学習し、タスク非関連オブジェク

深層学習軽量化・量子化
用途
ロボットの長い時間スケールのタスクプランニング
難易度
Hard
コスト
Medium
githubGitHubあり2026-06-05

Causal-Forcing — [ICML 2026] Official codebase for "Causal Forcing: Autoregressive Diffusion Distillation Done Right for High-Quality Real-Time Interactive Video Generation" & Causal Forcing++

この論文では、Causal-Forcing: Autoregressive Diffusion Distillation Done Right for High-Quality Real-Time Interactive

品質予測/異常検知深層学習軽量化・量子化生成テキスト動画
用途
高品質のビデオ生成を実現する。
難易度
Easy
コスト
High
arxivPaper only2026-06-04

Nonreversible Gauge Fields in Fokker--Planck Dynamics: Supersymmetric Hamiltonians and Learned Finite Forces

この研究では、詳細バランスが保持される非復元的修正をフォッカー-プラッツ動力学に導入し、その結果を解析しました。これにより、動力学の安定性と変化をより深く理解することができました。

深層学習正規化・最適化手法
用途
フォッカー=プラッツ動力学を非復元的に修正する
難易度
Hard
コスト
High
arxivPaper only2026-06-04

Symmetric Divergence and Normalized Similarity: A Unified Topological Framework for Representation Analysis

ペアのトポロジー的な距離に関する制約を満たすための統一的なトポロジーコーラムを開発しました。これにより、トポロジー的な距離の精度を向上でき、信頼できる結果として得られることができました。

深層学習CNN検出
用途
頂点間のトポロジー的な距離
難易度
Hard
コスト
High
arxivPaper only2026-06-04

PAC-Bayesian Adversarially Robust Generalization for Message Passing Graph Neural Networks: A Sensitivity Analysis

この研究では、強い攻撃に対してグラフニューラルネットワーク (GNN) の安定した推論を保つために、PAC-ベイズ分析を使用して GNN の一般性を分析します。新しい分析方法を提案することで、GNN の弱信頼性の推論結果

深層学習Transformer分類埋め込み
用途
弱信頼性の推論結果を防ぐ方法を開発
難易度
Hard
コスト
Low
arxivPaper only2026-06-04

TinyML-Driven Cybersecurity for Autonomous Spacecraft: Latency-Accuracy Analysis for SPARTA RF and Cyber Threat Detection

この研究では、自律宇宙船のサイバーセキュリティ対策を実施しました。研究結果によると、TinyMLを用いたクラシカルなモデルは、SPARTA 攻撃モデルに対する対策が最も効果的であると報告されました。

表形式向きCPUで試しやすい深層学習軽量化・量子化検出回帰
用途
自律宇宙船のサイバーセキュリティ対策
難易度
Hard
コスト
Medium
arxivPaper only2026-06-04

Zero-Copy Semantic Contagion: An In-Memory Streaming Architecture for Evolving Attention Graphs

分析モデルは、特定のアセットを中心とした分析に特化しており、異業連鎖の変動を反映していなかった。そのため、関連企業の注意を考慮し、連続時間グラフを用いて、分析結果をより包括的に表現することができる。

CPUで試しやすいセンサ/時系列深層学習RNN / LSTM予測テキスト時系列
用途
分析結果を連続時間グラフで表示
難易度
Hard
コスト
Low
arxivPaper only2026-06-04

Sample-efficient Low-level Motion Planning for Robotic Manipulation Tasks via Zero-shot Transfer Learning

工業用ロボットのmotion planningの高速化と効率化を目指し、サンプル効率的な低レベルmotion planningアルゴリズムとゼロショットトランスファーレーニングを組み合わせる方法を提案する。

深層学習軽量化・量子化
用途
工業用ロボットのmotion planningの高速化
難易度
Hard
コスト
High
arxivPaper only2026-06-04

Quantifying Uncertainty In Wide Two-Layer Neural Networks: On The Law Of The Limiting Fluctuation Process

難しい問題であるニューラルネットワークの予測不確実性を量化することで、予測精度を高め、信頼性を向上させる。深いアンサンブル法は複数のモデルの訓練および評価を必要とする。対照的に、ここでは潜在分散偏差の情報を使用して、広い

少数データ向き深層学習軽量化・量子化回帰
用途
2次元ニューラルネットワークの分散不確実性を量化する
難易度
Hard
コスト
High
arxivPaper only2026-06-04

HANDOFF: Humanoid Agentic Task-Space Whole-Body Control via Distilled Complementary Teachers

HANDOFFは、人間を模倣するロボットの制御を実現するために構築されたフレームワークです。ロボットはタスクを認識し、動作を生成します。HANDOFFは、タスクに合わせて動作を生成するアジエントを形成するために、教師と学

深層学習軽量化・量子化テキスト
用途
人間臭いアジентыのロボット制御を実現
難易度
Hard
コスト
Medium
arxivPaper only2026-06-04

Ensuring Interaction Safety in Multitask Exoskeleton Control: A Simulation-Trained Variable Impedance Framework

この研究では、ロボット用ワープロートのサンプリングを改善するための新しい方法を提案します。 Waypoints Matter は、ロボットが目標地に向かって進むための最適なルートを決定します。

深層学習Transformer生成
用途
ロボット用ワープロートのサンプリング
難易度
Hard
コスト
Medium
arxivPaper only2026-06-04

AffordanceVLA: A Vision-Language-Action Model Empowering Action Generation through Affordance-Aware Understanding

このリポジトリでは、画像認識モデルにアクション生成能力を付与することを目指したモデルを提案します。このモデルは、画像認識のための事前訓練モデルを用いて、複雑なアクションを生成することができます。

深層学習Transformer検出生成予測
用途
画像認識とアクションの生成
難易度
Hard
コスト
High
arxivPaper only2026-06-04

RealDexUMI: A Wearable Universal Manipulation Interface for Dexterous Robot Learning

ドローンが突然ローターの故障を起こすと、その回復が物理的に不可能になる危険があるため、パッシブ・フェイルサフティファックト・フライト・コントロールが必要になる。

センサ/時系列品質予測/異常検知深層学習軽量化・量子化
用途
6次元動作可能なドローンへの障害対策
難易度
Hard
コスト
Low
arxivPaper only2026-06-04

Learning of Robot Safety Policies via Adversarial Synthetic Scenarios

この研究では、シニティックなシナリオを用いたロボットの安全性ポリシーの学習を提案します。Red TeamとBlue Teamは、プログラミング言語のガミフィケーションフレームワークを用いて、シナリオ生成をアドバレッシアル

深層学習軽量化・量子化生成
用途
ラボットの安全性ポリシーの学習
難易度
Hard
コスト
Low
githubGitHubあり2026-06-03

pytorch-image-models — The largest collection of PyTorch image encoders / backbones. Including train, eval, inference, export scripts, and pretrained weights -- ResNet, ResNeXT, EfficientNet, NFNet, Vision Transformer (ViT), MobileNetV4, MobileNet-V3 & V2, RegNet, DPN, CSPNet, Swin Transformer, MaxViT, CoAtNet, ConvNeXt, and more

PyTorchで使用できる画像エンコーダとバックボーンの最大のコレクションです。トレーニング、評価、推論など様々なスクリプトや事前の重み付きデータが含まれます。

深層学習Transformer分類画像
用途
PyTorchで使用できる画像エンコーダとバックボーン
難易度
Easy
コスト
High
arxivPaper only2026-06-02

Set-Preserving Calibration from Conformal P-Values to E-Values

スタンダードなコンフォーマル推測 (CP) 手法では、p値を使用します。しかし、p値だけで十分ではありません。e値ベースのコンフォーマル推測手法はp値と連関があることを実証しました。e-value手法はstatistic

品質予測/異常検知深層学習軽量化・量子化
用途
標準CP手法とe-valueベースのCP手法の連関性を確立する
難易度
Hard
コスト
Low
arxivPaper only2026-06-02

Few-Shot Prediction for Pulsar Noise with Long Short-Term Memory Network

パルサーのタイミング残差を予測するために、長短期記憶ネットワーク (LSTM) を用いて提案しました。このLSTMは、小数数の時間残差に最も適しています。しかし、LSTMのトレーニングには時間がかかり、パルサー数が豊富な

少数データ向きCPUで試しやすい深層学習RNN / LSTM
用途
パルサーのタイミング残差を予測するためのLSTM
難易度
Hard
コスト
Medium
arxivPaper only2026-06-02

Analytical Evaluation of DCA Convergence Properties for Minimizing Prediction Functions of Gaussian RBF Support Vector Regression

SVRモデルの中で、特定の目的関数の最適化に応用できる、DC法を適用する手法を提案しました。具体的には、 DCの構造を分析し、それを適用することで、最適化のプロセスが改善されます。

深層学習軽量化・量子化回帰
用途
Gaussian RBF SVRのためのDC法を適用する
難易度
Hard
コスト
High
arxivPaper only2026-06-02

PrimeSVT: An Automated Memory-aware Pruning Framework with Prioritized Compression Policy for Spiking Vision Transformers

スパイキングビジョン トランスフォームの量子の減少のために、物理学的に基づいた量子の削減方式を提案する。この方式は、モデルを物理的に削減する際に発生する不均衡を補正するために、モデルに特化した前処理と後処理を実施する。

深層学習Transformer
用途
スパイキングビジョン トランスフォームの量子の減少
難易度
Hard
コスト
Low
githubGitHubあり2026-06-02

LLMs-from-scratch — Implement a ChatGPT-like LLM in PyTorch from scratch, step by step

この研究では、COVID-19臨床パスウェイズの予測監視を支援するために、パイプラインを構築しました。このパイプラインには、データリフティング、時間的再構成、イベントログの構築、プリフィックスベースの表現、予測モデルの整

深層学習Transformer生成
用途
医療機器へのアクセスを予測する
難易度
Easy
コスト
High
githubGitHubあり2026-05-29

PaLM-rlhf-pytorch — Implementation of RLHF (Reinforcement Learning with Human Feedback) on top of the PaLM architecture. Basically ChatGPT but with PaLM

この論文では、Reinforcement Learning with Human Feedback (RLHF) を元にしたPaLMアーキテクチャの実装を提示します。基本的にChatGPTのようなLLMですが、PaLMと

深層学習Transformer強化学習
用途
LLMのトレーニングデータと人間のフィードバック
難易度
Easy
コスト
High
githubGitHubあり2026-05-26

finetrainers — Scalable and memory-optimized training of diffusion models

誤差の拡散モデルをスケーラブルにトレーニングすることで、Language Modelsの高速化を実現できます。この研究では、diffusion modelsをスケーラブルにトレーニングするための手法を提案し、 Langu

深層学習Transformer
用途
誤差の拡散モデルをスケーラブルにトレーニングすることによって、Language Modelsを高速化する
難易度
Easy
コスト
High
arxivPaper only2026-05-22

UniSpike: Accelerating Spiking Neural Networks on Neuromorphic Systems via Eliminating Address Redundancy

スパイクニューラルネットワークを高速化するUniSpikeを提案しています。このフレームワークは、スパイク通信を削減するためのAddress Aggregationテクニックを提案しています。

深層学習軽量化・量子化
用途
リソースエネルギー効率を向上させるためのスパイク通信
難易度
Hard
コスト
Low
arxivPaper only2026-05-22

Introspection Dynamics with Mutation in Additive Games

コラボレーションはさまざまなシステムにおいて協力的な行動を促進する重要な要素であり、個人が異なるリソースと生産性を持つ状況をモデル化するためにインタロースペクションのメカニズムが用いられます。このメカニズムは、個人が他の

深層学習Transformer
用途
協力的な行動を促進する複数プレイヤーのゲーム
難易度
Hard
コスト
Medium
arxivPaper only2026-05-22

Beyond the Half-Approximation: Fair and Efficient Online Class Matching

オンラインマッチング問題では、オブジェクトが事前に知られているが、アイテムが連続して到着し、不可逆的に割り当てられるときに、それらの要件と競合する値を分割するため、複雑性を理解することは重要です。複雑さの増大とともに、複

深層学習軽量化・量子化
用途
オンラインマッチング問題において公平さを確保する
難易度
Hard
コスト
Medium
arxivPaper only2026-05-21

Guiding Multi-Objective Genetic Programming with Description Length Improves Symbolic Regression Solutions

GPを用いたシンボル回帰における精度の向上。シンボル回帰においては多項式が使用されることが多く、オーバーフィッティングやブラーの問題が発生する。GPの過学習を防ぎ、精度の高いパラメータを得るために、説明長さとfracti

深層学習軽量化・量子化回帰
用途
精度の高いシンボル回帰を目的としている
難易度
Hard
コスト
Medium
arxivPaper only2026-05-21

Joint Communication and Computation Scheduling for MEC-enabled AIGC Services: A Game-Theoretic Stochastic Learning Approach

Mobil Edge Computing (MEC)は、端末近くにゲストOSを設置し、AI生成コンテンツを高速化するものです。複数のゲストOS間の通信や計算スケジュールをオフラインで調整するゲーム理論的学習アプローチを提

深層学習軽量化・量子化生成
用途
AI生成コンテンツを高速化する
難易度
Hard
コスト
High
githubGitHubあり2026-05-21

pytorch-grad-cam — Advanced AI Explainability for computer vision. Support for CNNs, Vision Transformers, Classification, Object detection, Segmentation, Image similarity and more.

このライブラリは、コンピューター ビジョンのための高度なAI解釈と可視化ソリューションです。このライブラリは、CNN、ビジョン トランスフォーム、分類、物体検出、分割、画像類似度など、さまざまなコンピューター ビジョンの

深層学習Transformer分類検出セグメンテーション
用途
AIの解釈と可視化ソリューション
難易度
Easy
コスト
Low
arxivPaper only2026-05-20

Dropout Universality: Scaling Laws and Optimal Scheduling at the Edge-of-Chaos

オンラインでログされた広告のオフラインポリシーセレクション用の方法が提案されました。提案された方法は、ポリシーセレクションのための重要性を特定するために、リプレイ表を活用しています。この方法は、リプレイ表の不完全性を考慮

深層学習Transformer
用途
技術検証・論文読解補助
難易度
Hard
コスト
Medium
arxivPaper only2026-05-20

Approximation Theory for Neural Networks: Old and New

この研究では、近四十年の間に、このような定性的汎用性結果が発展しました。これにより、関数の近似係数、パラメータの量、誤差の分配、精力的なパターンなどの量的理論が提供されます。この理論は、関数の近似に特化していますが、関連

深層学習
用途
数理的根拠をもって人工知能ネットワークの精力的な能力を説明する基礎となる理論を形成する
難易度
Hard
コスト
Medium
arxivPaper only2026-05-20

Genetic Programming with Transformer-Based Mutation for Approximate Circuit Design

この研究では、トランスファーマーをベースにした変換の方法を使用することで、Cartesian遺伝的プログラミング (CGP) を使用してニュルアルネットワークの設計の最適化方法が改善されました。この研究では、トランスファ

深層学習Transformer
用途
精度が要求される信号処理の分野で、計算資源やエネルギー消費などを少なくしたり高速化したりするため、精度と効率を高められるニューラルネットワークの設計を自動化する
難易度
Hard
コスト
High
arxivPaper only2026-05-15

Towards Code-Oriented LM Embeddings for Surrogate-Assisted Neural Architecture Search

これは、パフォーマンスの高いモデルサイズの減少を実現するために、Perforated Neural Networkがキーワード検出タスクに適用されていることを検証したり、Edge Impulseで動作するキーワード検出シ

説明可能品質予測/異常検知深層学習軽量化・量子化回帰テキスト
用途
キーワード検出
難易度
Hard
コスト
Low
arxivPaper only2026-05-14

NeuroTrain: Surveying Local Learning Rules for Spiking Neural Networks with an Open Benchmarking Framework

スパイク型ニューラルネットワーク(SNN)は生物学的信号の模倣であり、電気信号によって情報を伝達し、計算の最適化を行います。この研究では、ニューロン間の信号伝達をスパイク信号で表現するスパイク型ニューラルネットワークのた

説明可能深層学習軽量化・量子化
用途
スパイク型ニューラルネットワークの訓練法を導入すること
難易度
Hard
コスト
High
arxivGitHubあり2026-05-14

An Amortized Efficiency Threshold for Comparing Neural and Heuristic Solvers in Combinatorial Optimization

ネットワーク解決機器とCPUのメタハイスティクスのエネルギー効率の比較は、機械学習のコンボイナタルオプティミゼーションの一般的な議論の主な論点の1つです。この議論では、機械学習のトレーニングにはGPUで大量のエネルギーが

CPUで試しやすい品質予測/異常検知深層学習軽量化・量子化
用途
コンビネータル オプティミゼーション問題の解決
難易度
Hard
コスト
High
arxivPaper only2026-05-14

Temporal Fair Division in Multi-Agent Systems: From Precise Alternation Metrics to Scalable Coordination Proxies

このリポジトリでは、タイムリーな公平分配に特化した新しいメトリック、Rotational Periodicity(RP)とAltファミリーのスライドウィンドウメトリックを提案します。このフレームワークは、リアルタイムの多

深層学習軽量化・量子化
用途
マルチエージェント系のタイムリーな公平分配
難易度
Hard
コスト
Medium
arxivPaper only2026-05-13

Embodied Neurocomputation: A Framework for Interfacing Biological Neural Cultures with Scaled Task-Driven Validation

バイオロジカルニューロン接続とシリコンコンピューティングを統合し、エンボディッドニューロコンピューティشنフレームワークを開発し、ニューラルネットワークとバイオロジカルニューロンを接続するための新しいシステムを提案した。

深層学習軽量化・量子化
用途
バイオロジカルニューロン接続
難易度
Hard
コスト
Medium