generation」の検索結果

367
githubGitHubあり2026-06-09

system_prompts_leaks — Extracted system prompts from Anthropic - Claude Fable 5, Opus 4.8, Claude Code, Claude Design. OpenAI - ChatGPT 5.5 Thinking, GPT 5.5 Instant, Codex. Google - Gemini 3.5 Flash, 3.1 Pro, Antigravity. xAI - Grok, Cursor, Copilot, VS Code, Perplexity, and more. Updated regularly.

本論文は、言語モデルの最適化に使用される Hyperparameter Transfer を量化するフレームワークを開発します。このフレームワーフークは、3 つのメトリックスを使用し、そのうちの 1 つは、hyperpa

説明可能深層学習Transformer生成
用途
言語モデルの最適化
難易度
Easy
コスト
Medium
githubGitHubあり2026-06-09

Awesome-Item-ID-Gen-RecSys — Updating curated list of research advancements on item identification and item tokenization in generative recommender systems. The survey is titled "A Survey of Item Identifiers in Generative Recommendation: Construction, Alignment, and Generation"

本研究では、生成推奨システムにおけるアイテムIDの構築、調整、生成の手法について、アイテムIDの構築方法を分析しています。

自然言語処理大規模言語モデル生成
用途
生成推奨システムのアイテムIDの問題解決
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

qdrant — Qdrant - High-performance, massive-scale Vector Database and Vector Search Engine for the next generation of AI. Also available in the cloud https://cloud.qdrant.io/

このリポジトリでは、データとAIアルゴリズムを製品化するためのプラットフォームであるTaipyを提供しています。

自然言語処理埋め込み・検索生成画像
用途
AIアプリケーションを製品化するためのプラットフォーム
難易度
Easy
コスト
Low
githubGitHubあり2026-06-09

agent-starter-pack — Ship AI Agents to Google Cloud in minutes, not months. Production-ready templates with built-in CI/CD, evaluation, and observability.

AIエージェントをGoogle Cloudに展開することが可能で、CI/CD、評価、観察など、プロダクションリードテンプレートが事前に用意されています。

自然言語処理大規模言語モデル生成
用途
AIエージェントをGoogle Cloudに展開
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

kserve — Standardized Distributed Generative and Predictive AI Inference Platform for Scalable, Multi-Framework Deployment on Kubernetes

flyteは、高度に動的で堅牢なAIオーケストレーションプラットフォームであり、データ、モデル、コンピューティングを統合してAIワークフローを作成することができます。

自然言語処理大規模言語モデル生成
用途
エクスペリメントトラッカーを簡単にする
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

haystack — Open-source AI orchestration framework for building context-engineered, production-ready LLM applications. Design modular pipelines and agent workflows with explicit control over retrieval, routing, memory, and generation. Built for scalable agents, RAG, multimodal applications, semantic search, and conversational systems.

オープンソースのAIオーケストレーションフレームワークです。LLMアプリケーションの構築に必要なパイプラインやエージェントワークフローの設計ができるようになっています。

深層学習Transformer生成要約テキスト
用途
LLMアプリケーションの構築
難易度
Easy
コスト
High
arxivPaper only2026-06-08

Echo-Memory: A Controlled Study of Memory in Action World Models

この研究では、エピソード記憶を制御するために、エピソード記憶モデルを設計および評価しました。エピソード記憶モデルは、エピソード内の重要な情報を記憶し、エピソード間の相関関係を特定することができます。

品質予測/異常検知コンピュータビジョンセグメンテーション生成画像テキスト
用途
エピソード記憶
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Data Synthesis and Parameter-Efficient Fine-Tuning for Low-Resource NMT: A Case Study on Q'eqchi' Mayan

この研究では、低リソース言語NMTのために、データ合成方法を開発しました。これにより、データ合成されたコーパスを使用し、NMTモデルをパラメータ効率的にフィーヌチュン化できます。

深層学習軽量化・量子化生成翻訳テキスト
用途
NMT低リソースデータ合成
難易度
Hard
コスト
Medium
arxivPaper only2026-06-08

Disentanglement with Holographic Reduced Representations

画像分割を目的としたDeep learningモデルを提案した論文です。Deep learningモデルが画像を構成するオブジェクトに適切に分割できるようにするために、画像を分割したときの画像の特徴量を用いて学習します。

品質予測/異常検知コンピュータビジョンセグメンテーション生成教師あり教師なし
用途
画像分割
難易度
Hard
コスト
Medium
arxivPaper only2026-06-08

Evaluating the Representation Space of Diffusion Models via Self-Supervised Principles

生成モデルDiffusionモデルの強度推論を評価するフレームワークを提案します。Diffusionモデルの表現能力と生成能力を評価するために、特徴量を不変成分と余分な成分に分割し、不変性汚染という概念を導入します。

品質予測/異常検知生成AI拡散モデル分類生成教師あり
用途
強度推論
難易度
Hard
コスト
High
arxivPaper only2026-06-08

When Do Local Score Models Extrapolate Across Size? A Diagnostic Theory and Benchmark

科学的生成モデリングでは、小規模な模型を大規模なもので評価することが要求される。モデルサイズの転移を確実に実現するためには、モデルサイズが大きくなるにつれてスコアが安定するかどうかを診断することが必要です。

生成AI拡散モデル生成
用途
ディメンションの転移
難易度
Hard
コスト
High
arxivGitHubあり2026-06-08

Assessing Sample Quality in Conditional Generation under Compositional Shift

Transformerベースのモデルを改良し、ゲノム規制的情報を組み込んだモデルを提案。遺伝情報を組み込むことで、遺伝子発現の解釈と予測の精度が向上することを示した。

MI向き品質予測/異常検知自然言語処理RAG生成
用途
ゲノム規制的情報を組み込んで遺伝子発現の解釈を向上させる
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Reasoning Arena: Trace Tournaments When Verifiable Rewards Fall Short

この研究では、強化学習のトレーニングに使用するRewardsの検証が難しい場合は、Rewardがグループレベルでは無価値で、グループ間の優劣比較が不可能となる問題に対処するためのReasoning Arenaを提案します

品質予測/異常検知深層学習軽量化・量子化生成テキスト強化学習
用途
強化学習のトレーニング
難易度
Hard
コスト
High
arxivGitHubあり2026-06-08

Internalizing Geometric Law: Learning from Solver Residuals for Precision-Critical Generation

自然言語から機械設計や技術図案などの正確な構成を作成することができるシステムを開発しました。このシステムは、Geometric Constraintsを満たす正確な構成を作成するために、Constraint DSL (D

自然言語処理大規模言語モデル生成テキスト
用途
機械設計や技術図案の生成
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Multi-View Speech Representation Learning for Parkinson's Disease Detection Using Context-guided Cross-modal Attention

パーキンソン病(PD)の早期検出への取り組みとして、脳の損傷が発症前に生じる話術障害を分析するため、音声分析を用いてパーキンソン病の診断を提唱しています。

センサ/時系列深層学習Transformer検出生成埋め込み
用途
パーキンソン病の早期 検出
難易度
Hard
コスト
High
arxivPaper only2026-06-08

BSTabDiff: Block-Subunit Diffusion Priors for High-Dimensional Tabular Data Generation

高次元表形式データでは、数値サンプル(n)が特徴数(m)を上回ることが多いです。つまりこれらのドメインでは、$\mathbb{R}^m$ で直接密度関数を表現することは非実際である。私たちは、BSTabDiff:ブロック

表形式向きコンピュータビジョンセグメンテーション生成表形式
用途
高次元表形式データの生成
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Powering the Future of AI: Navigating the Trade-offs for Europe's Energy Transition and Net-Zero Goals

巨大なAIデータセンターは、電力系統のプランニングや運用において構造的に大きな課題を引き起こします。21つのAI成長シナリオを含むヨーロッパの空間的explicitな最適化モデルを使用して、DCsの追加電力需要、容量要件

機械学習特徴量エンジニアリング生成
用途
データセンターのエネルギー消費削減
難易度
Hard
コスト
Medium
arxivPaper only2026-06-08

MASS: Deep Research for Social Sciences with Memory-Augmented Social Simulation

Social Scienceにおける、Memory-Augmented Social Simulationを利用した深層学習を利用して、新しい研究方法を提案し、Social Scienceの研究実現を実現した

品質予測/異常検知深層学習Transformer生成テキスト
用途
Social Scienceにおける、Memory-Augmented Social Simulationを利用した深層学習を利用した研究の実現
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Steganography Without Modification: Hidden Communication via LLM Seeds

大規模言語モデル(LLM)の推論スタックには、モデルの重み、サンプリングコード、および出力分布を変更することなく、暗号化なしで秘密コミュニケーションを行うステゴグラフィチャンネルが存在する。送信者はシークレットデータを秘

自然言語処理大規模言語モデル生成テキスト
用途
暗号化なし: LLMのシードを使用した秘密のコミュニケーション
難易度
Hard
コスト
High
arxivPaper only2026-06-08

LATTEArena: An Evaluation Framework for LLM-powered Tabular Feature Engineering (Extended Version)

LLMがTABULARデータ分析で機能を自動化できるようにした。しかし、標準化されたプラットフォームの欠如は、比較やコスト的評価を行うのを難しくしている。複雑なメソッドの設計により、各コンポーネントの具体的な貢献をはっき

少数データ向き表形式向き自然言語処理大規模言語モデル分類生成回帰
用途
TABULARデータ分析のLLMパラダイムの比較評価
難易度
Hard
コスト
High
arxivPaper only2026-06-08

The Token Not Taken: Sampling, State, and the Variability of AI Agent Outputs

Agentic AIシステムの不確実性が、同じ要求から異なる計画、ツールの呼び出しなどが生成されることを示唆している。このようにしてシステムの信頼性を確保するには、AIエージェントのパラメータを確立することが重要となる。

コンピュータビジョンセグメンテーション生成テキスト
用途
AIエージェントのパラメータの確立に寄与する
難易度
Hard
コスト
High
arxivPaper only2026-06-08

RTL-BenchLS: A Large-Scale Benchmark for RTL Reasoning and Generation with Large Language Models

LLMベースのRTL生成と推論は、ハードウェア設計自動化の新たな方向を示唆します。しかし、ベンチマークは、大規模化とタスクスコープの制約がある。現存するベンチマークでは、前向きモデルの実績

品質予測/異常検知自然言語処理大規模言語モデル生成テキスト自己教師
用途
RTLリージョニングと生成のための大規模ベンチマーク作成
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Quality-Diversity Search in Sound Generation: Investigating Innovation Engines for Audio Exploration

この研究では、音楽生成における多様性を促進するためのオープンソース・フレームワークを開発します。このフレームワークは、音楽生成における多様性の促進を支援するために、進化的プロセスと多様性促進アルゴリズムを組み合わせたもの

MI向き品質予測/異常検知自然言語処理ファインチューニング分類生成テキスト
用途
音楽生成における多様性の促進
難易度
Hard
コスト
Low
arxivPaper only2026-06-08

The Neutral Mask: How RLHF Provides Shallow Alignment while Leaving Partisan Structure Intact in a Large Language Model

この研究では、大規模言語モデルの安全性を評価するためのフレームワーク、PsychoSafe を開発します。このフレームワークは、大規模言語モデルの安全性を評価し、潜在的なリスクを軽減することができます。

自然言語処理大規模言語モデル生成テキスト強化学習
用途
大規模言語モデルの安全性評価
難易度
Hard
コスト
High
arxivPaper only2026-06-08

IS-CoT: Breaking the Long-form Generation Collapse via Interleaved Structural Thinking

この研究では、長文生成モデルの改良を実現するためのフレームワーク、IS-CoT を開発します。このフレームワークは、長文生成モデルの生成性とコントロール性を改善することができます。

品質予測/異常検知自然言語処理大規模言語モデル生成テキスト
用途
長文生成モデルの改良
難易度
Hard
コスト
High
arxivPaper only2026-06-08

DECSELFMASK: Leveraging Unlabeled Text via Self-Relevance-Guided Masking for Decoder-Only Classification

予備情報が少ない場合や医療分野などの特定の分野の場合、分類タスクは難しいようになるが、この研究では、モデルが未分類データを操作して、分類モデルの性能を向上させる方法である、DecSelfMaskを提案した。

自然言語処理RAG分類生成テキスト
用途
分類タスクの性能向上
難易度
Hard
コスト
High
arxivPaper only2026-06-08

H2HMem: A Multimodal Memory Benchmark for Agents in Human-Human Interactions

大きな言語モデルには記憶や推論機能があるが、ユーザーとの対話におけるこれらの機能の効果はまだ理解されているわけではない。これを受け、この研究では、人間の相互作用、特に会話における記憶と推論能力を評価するためのマルチモーダ

自然言語処理大規模言語モデル生成テキストマルチモーダル
用途
マルチモーダル記憶の評価
難易度
Hard
コスト
High
arxivPaper only2026-06-08

AbstRAG: Learning to Abstract for Retrieval Problems

この研究では、検索タスクにおける抽象レベルにおけるギャップを解消するためのフレームワークであるAbstRAGを提案し、検索タスクにおけるギャップを解消したことで、モデルが検索タスクにおいて正しく情報を開示した。

品質予測/異常検知自然言語処理RAG生成検索テキスト
用途
リトラバージャグによる検索
難易度
Hard
コスト
Low
githubGitHubあり2026-06-08

VoxCPM — VoxCPM2: Tokenizer-Free TTS for Multilingual Speech Generation, Creative Voice Design, and True-to-Life Cloning

マルチラギングスピーチ生成やクリエイティブボイスデザイン、ルートライフクライミングなど、テクスチャファリーTTSの最新技術を実現するためのフレームワークです。

生成AI音声・音楽生成生成テキスト音声
用途
マルチラギングスピーチ生成
難易度
Easy
コスト
Medium
githubGitHubあり2026-06-06

DiT-Extrapolation — Official implementation for "RIFLEx: A Free Lunch for Length Extrapolation in Video Diffusion Transformers" (ICML 2025) , UltraViCo (ICLR 2026) and UltraImage

分類問題では、多くの場合、ラベルは存在しないため、従来の学習アルゴリズムでは困難に感じられるが、In-Context Multiple Instance Learningという手法を使用することで、低ラベル環境で効率的に

深層学習Transformer生成画像動画
用途
多クラス分類タスク
難易度
Easy
コスト
High
githubGitHubあり2026-06-06

RAG_Techniques — This repository showcases various advanced techniques for Retrieval-Augmented Generation (RAG) systems. Each technique has a detailed notebook tutorial.

医学画像に対する疾患検出モデルを開発し、臨床現場で早期検出と迅速な介入を容易にすることを目的としたフレームワークを提案します。

自然言語処理大規模言語モデル生成
用途
医学画像の疾患検出
難易度
Easy
コスト
High
arxivPaper only2026-06-05

Automatic, Debiased, and Invariant Counterfactual Generation under General Interventions

Generative models for counterfactual outcomesは、決定をサポートするために複雑な干渉に対して、潜在的な結果を生成するための優れたポテンシャルを持っています。しかし、対象外データ

強化学習方策勾配 (PPO / A3C)生成回帰
用途
再現性の低いデータに対して対象外データの生成
難易度
Hard
コスト
Medium
arxivPaper only2026-06-05

Dash2Sim: Closed-Loop Driving Simulation from in-the-wild Dashcam Videos

この論文では、ドライビングシミュレーションのためのフレームワークを提案しています。このフレームワークは、ドライビングシミュレーションを目的とした機械学習フレームワークです。このフレームワークは、大量のデータを扱う必要があ

センサ/時系列品質予測/異常検知コンピュータビジョン3D・点群生成テキスト動画
用途
ドライビングシミュレーションのためのフレームワーク
難易度
Hard
コスト
High
arxivPaper only2026-06-05

Beyond Waypoints: A Trajectory-Centric Waypointing Paradigm for Vision-Language Navigation

この研究では、自然言語指示を実行するためにもっと実際的なエンベロイメントにおいて、視覚言語航行 (VLN) の問題に対処します。従来の 3 つのステージのアプローチは、目的地に到達するのを困難な場所や、計画と制御間の矛盾

コンピュータビジョンマルチモーダル生成
用途
自動車のトラクタシー
難易度
Hard
コスト
High
githubGitHubあり2026-06-05

Causal-Forcing — [ICML 2026] Official codebase for "Causal Forcing: Autoregressive Diffusion Distillation Done Right for High-Quality Real-Time Interactive Video Generation" & Causal Forcing++

この論文では、Causal-Forcing: Autoregressive Diffusion Distillation Done Right for High-Quality Real-Time Interactive

品質予測/異常検知深層学習軽量化・量子化生成テキスト動画
用途
高品質のビデオ生成を実現する。
難易度
Easy
コスト
High
arxivPaper only2026-06-04

Discrete Causal Representations from Heterogeneous Domains: A Bayesian Approach with Social Survey Applications

この研究では、複数のドメインの複雑なデータを分析するために、Bayesian モデルを使用して因果関係を分析するツールを開発します。主に社会調査に使用できるツールです。

説明可能コンピュータビジョンセグメンテーション生成埋め込みマルチモーダル
用途
複数のドメインの因果関係を分析するツールを開発
難易度
Hard
コスト
High
arxivPaper only2026-06-04

Ensuring Interaction Safety in Multitask Exoskeleton Control: A Simulation-Trained Variable Impedance Framework

この研究では、ロボット用ワープロートのサンプリングを改善するための新しい方法を提案します。 Waypoints Matter は、ロボットが目標地に向かって進むための最適なルートを決定します。

深層学習Transformer生成
用途
ロボット用ワープロートのサンプリング
難易度
Hard
コスト
Medium
arxivPaper only2026-06-04

AffordanceVLA: A Vision-Language-Action Model Empowering Action Generation through Affordance-Aware Understanding

このリポジトリでは、画像認識モデルにアクション生成能力を付与することを目指したモデルを提案します。このモデルは、画像認識のための事前訓練モデルを用いて、複雑なアクションを生成することができます。

深層学習Transformer検出生成予測
用途
画像認識とアクションの生成
難易度
Hard
コスト
High
arxivPaper only2026-06-04

Learning of Robot Safety Policies via Adversarial Synthetic Scenarios

この研究では、シニティックなシナリオを用いたロボットの安全性ポリシーの学習を提案します。Red TeamとBlue Teamは、プログラミング言語のガミフィケーションフレームワークを用いて、シナリオ生成をアドバレッシアル

深層学習軽量化・量子化生成
用途
ラボットの安全性ポリシーの学習
難易度
Hard
コスト
Low
githubGitHubあり2026-06-04

Awesome-Video-World-Models-with-AR-Diffusion — A Curated List of Awesome Video World Models with AR Diffusion: Covering Algorithms, Applications, and Infrastructure, Aimed at Serving as a Comprehensive Resource for Researchers, Practitioners, and Enthusiasts.

ビデオのワールドモデルを用いて、AR拡散式を含む幅広いアルゴリズム、アプリケーション、インフラが提供され、研究者や実務家など幅広い人々に役立つリソースとして提供される。

生成AI拡散モデル生成動画
用途
アンビシャスのためのビデオの世界モデル
難易度
Easy
コスト
High
githubGitHubあり2026-06-03

llm-app — Ready-to-run cloud templates for RAG, AI pipelines, and enterprise search with live data. 🐳Docker-friendly.⚡Always in sync with Sharepoint, Google Drive, S3, Kafka, PostgreSQL, real-time data APIs, and more.

この論文では、RAG、AIパイプライン、企業検索を含むクラウド テンプレートを提供するアプリケーション「llm-app」を紹介します。 llm-app は Docker で動作し、Sharepoint、Google Dr

自然言語処理大規模言語モデル生成
用途
AIパイプラインを構築する
難易度
Easy
コスト
High
githubGitHubあり2026-06-02

LLMs-from-scratch — Implement a ChatGPT-like LLM in PyTorch from scratch, step by step

この研究では、COVID-19臨床パスウェイズの予測監視を支援するために、パイプラインを構築しました。このパイプラインには、データリフティング、時間的再構成、イベントログの構築、プリフィックスベースの表現、予測モデルの整

深層学習Transformer生成
用途
医療機器へのアクセスを予測する
難易度
Easy
コスト
High
githubGitHubあり2026-06-02

Awesome-CVPR2026-CVPR2025-ICCV2025-CVPR2024-ECCV2024-AIGC — A Collection of Papers and Codes for CVPR2026/CVPR2025/ICCV2025/CVPR2024/ECCV2024 AIGC

CVPRに基づくAIを取り入れるための資料集を提供します。CVPR 2026、2025、2024、およびECCV 2024に基づくAIGCに関する研究論文とソフトウェアコードを含みます。

コンピュータビジョン3D・点群生成画像動画
用途
AIをCVPRに応用する
難易度
Easy
コスト
High
githubGitHubあり2026-05-27

memvid — Memory layer for AI Agents. Replace complex RAG pipelines with a serverless, single-file memory layer. Give your agents instant retrieval and long-term memory.

MemVidは、サーバーレスで単一ファイルの記憶層を提案し、AIエージェントが即時検索と長期的な記憶を持つようにする記憶層です。

自然言語処理大規模言語モデル生成テキスト動画
用途
AIエージェントの記憶を管理する
難易度
Easy
コスト
High
githubGitHubあり2026-05-24

custom-diffusion — Custom Diffusion: Multi-Concept Customization of Text-to-Image Diffusion (CVPR 2023)

CVPR 2023で発表されたCustom Diffusionは、テキストから画像を生成するプロセスをカスタマイズできるDiffusionモデルです。テキストからイメージを生成する際の要件を設定できるので、画像生成の柔軟

自然言語処理ファインチューニング生成画像テキスト
用途
画像生成のカスタマイズ
難易度
Easy
コスト
High
arxivPaper only2026-05-21

Vector Policy Optimization: Training for Diversity Improves Test-Time Search

language modelは、現在、novelな環境に一般化することが求められ、推論尺度を伸ばす検索手法であるAlphaEvolveと組み合わせることが求められます。しかし、標準的なparadigmではLLMは、pre

自然言語処理大規模言語モデル生成テキスト
用途
language modelの検索タスクに対応するために多様性を強化する
難易度
Hard
コスト
High
arxivPaper only2026-05-21

Quantum Genetic Optimization for Negative Selection Algorithms in Anomaly Detection

この論文では、アノマリーディテクションにおける負の選択アルゴリズムを最適化するために、量子遺伝アルゴリズムを導入します。这により、検出器の生成効率を向上させることができ、精度も向上します。

品質予測/異常検知自然言語処理ファインチューニング検出生成異常検知
用途
アノマリーディテクションにおける負の選択アルゴリズムの最適化
難易度
Hard
コスト
Medium
arxivPaper only2026-05-21

Joint Communication and Computation Scheduling for MEC-enabled AIGC Services: A Game-Theoretic Stochastic Learning Approach

Mobil Edge Computing (MEC)は、端末近くにゲストOSを設置し、AI生成コンテンツを高速化するものです。複数のゲストOS間の通信や計算スケジュールをオフラインで調整するゲーム理論的学習アプローチを提

深層学習軽量化・量子化生成
用途
AI生成コンテンツを高速化する
難易度
Hard
コスト
High
arxivGitHubあり2026-05-07

CoupleEvo: Evolving Heuristics for Coupled Optimization Problems Using Large Language Models

CoupleEvoは、大規模言語モデルを活用したカップルの最適化問題の自動ヒューリスティクーデザインアプローチを提案します。3つの進化的調整戦略が提示されます。

品質予測/異常検知自然言語処理大規模言語モデル生成テキスト
用途
カップルの最適化問題を解決する
難易度
Hard
コスト
High