41 articles

Category

生成AI

Diffusion、画像生成、動画生成など、生成モデルの実装可否と推論コストを重視して整理します。

拡散モデルGANVAE画像生成動画生成音声・音楽生成

人気記事

新着記事

未読 41
arxivPaper only2026-06-08

Evaluating the Representation Space of Diffusion Models via Self-Supervised Principles

生成モデルDiffusionモデルの強度推論を評価するフレームワークを提案します。Diffusionモデルの表現能力と生成能力を評価するために、特徴量を不変成分と余分な成分に分割し、不変性汚染という概念を導入します。

品質予測/異常検知生成AI拡散モデル分類生成教師あり
用途
強度推論
難易度
Hard
コスト
High
arxivPaper only2026-06-08

When Do Local Score Models Extrapolate Across Size? A Diagnostic Theory and Benchmark

科学的生成モデリングでは、小規模な模型を大規模なもので評価することが要求される。モデルサイズの転移を確実に実現するためには、モデルサイズが大きくなるにつれてスコアが安定するかどうかを診断することが必要です。

生成AI拡散モデル生成
用途
ディメンションの転移
難易度
Hard
コスト
High
githubGitHubあり2026-06-08

VoxCPM — VoxCPM2: Tokenizer-Free TTS for Multilingual Speech Generation, Creative Voice Design, and True-to-Life Cloning

マルチラギングスピーチ生成やクリエイティブボイスデザイン、ルートライフクライミングなど、テクスチャファリーTTSの最新技術を実現するためのフレームワークです。

生成AI音声・音楽生成生成テキスト音声
用途
マルチラギングスピーチ生成
難易度
Easy
コスト
Medium
githubGitHubあり2026-06-04

Awesome-Video-World-Models-with-AR-Diffusion — A Curated List of Awesome Video World Models with AR Diffusion: Covering Algorithms, Applications, and Infrastructure, Aimed at Serving as a Comprehensive Resource for Researchers, Practitioners, and Enthusiasts.

ビデオのワールドモデルを用いて、AR拡散式を含む幅広いアルゴリズム、アプリケーション、インフラが提供され、研究者や実務家など幅広い人々に役立つリソースとして提供される。

生成AI拡散モデル生成動画
用途
アンビシャスのためのビデオの世界モデル
難易度
Easy
コスト
High
githubGitHubあり2026-05-30

awesome-diffusion-model-in-rl — A curated list of Diffusion Model in RL resources (continually updated)

この論文では、ディフュージョンモデルのRLリソースをリストアップし、最新化されています。RLとディフュージョンモデルを学習するためのリソースのリストを作成することが可能です。

生成AI拡散モデル
用途
ディフュージョンモデルのリソースリスト
難易度
Easy
コスト
High