580 articles

Category

自然言語処理

LLM、RAG、埋め込み、ファインチューニングなど、AIアプリ実装に必要な自然言語処理技術を整理します。

大規模言語モデルRAGファインチューニングプロンプトエンジニアリング埋め込み・検索トークナイザ

人気記事

新着記事

未読 580
githubGitHubあり2026-06-09

prompts.chat — f.k.a. Awesome ChatGPT Prompts. Share, discover, and collect prompts from the community. Free and open source — self-host for your organization with complete privacy.

prompts.chatは、コミュニティが共有したChatGPT用のプロンプットを発見・収集できる場所で、無料でオープンソースで提供されている。

自然言語処理大規模言語モデル
用途
チャットGPT用のプロンプトを共有
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

Awesome-Item-ID-Gen-RecSys — Updating curated list of research advancements on item identification and item tokenization in generative recommender systems. The survey is titled "A Survey of Item Identifiers in Generative Recommendation: Construction, Alignment, and Generation"

本研究では、生成推奨システムにおけるアイテムIDの構築、調整、生成の手法について、アイテムIDの構築方法を分析しています。

自然言語処理大規模言語モデル生成
用途
生成推奨システムのアイテムIDの問題解決
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

unsloth — Unsloth Studio is a web UI for training and running open models like Gemma 4, Qwen3.6, DeepSeek, gpt-oss locally.

Unsloth Studioは、オープンモデルのトレーニングと実行を支援するWebUIです。このライブラリは、Gemma4、Qwen3.5などのオープンモデルのテストとトレーニングを支援するために使われます。

自然言語処理大規模言語モデルテキスト音声
用途
オープンモデルのトレーニングと実行
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

wandb — The AI developer platform. Use Weights & Biases to train and fine-tune models, and manage models from experimentation to production.

Weights & Biasesは、AI開発を支援するプラットフォームです。このプラットフォームは、モデル開発から生産準備までを支援し、コストをコントロールし、モデルとデータへのアクセスを管理します。

自然言語処理ファインチューニング
用途
AI開発プラットフォーム
難易度
Easy
コスト
Medium
githubGitHubあり2026-06-09

ART — Agent Reinforcement Trainer: train multi-step agents for real-world tasks using GRPO. Give your agents on-the-job training. Reinforcement learning for Qwen3.6, GPT-OSS, Llama, and more!

ARTは、多段強化学習トレーナーです。このトレーナーは、GRPOを使用して、現実世界のタスクに対して、多段強化学習を行うことができます。

自然言語処理大規模言語モデル強化学習
用途
多段強化学習トレーナー
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

Mooncake — Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.

この論文では、LLM を提供するために使用される Mooncake サービス プラットフォームについて説明しています。Mooncakeは、Kimi というリーディングのLLMサービスを提供するサービスです。Kimiは、M

自然言語処理大規模言語モデル
用途
LLM用サービングプラットフォーム
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

qdrant — Qdrant - High-performance, massive-scale Vector Database and Vector Search Engine for the next generation of AI. Also available in the cloud https://cloud.qdrant.io/

このリポジトリでは、データとAIアルゴリズムを製品化するためのプラットフォームであるTaipyを提供しています。

自然言語処理埋め込み・検索生成画像
用途
AIアプリケーションを製品化するためのプラットフォーム
難易度
Easy
コスト
Low
githubGitHubあり2026-06-09

mlflow — The open source AI engineering platform for agents, LLMs, and ML models. MLflow enables teams of all sizes to debug, evaluate, monitor, and optimize production-quality AI applications while controlling costs and managing access to models and data.

このリポジトリでは、AIワークロードを管理するためのシステムであるSkypilotを提供しています。

品質予測/異常検知自然言語処理大規模言語モデル
用途
AIワークロードを管理するためのシステム
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

skypilot — Run, manage, and scale AI workloads on any AI infrastructure. Use one system to access & manage all AI compute (Kubernetes, Slurm, 20+ clouds, on-prem).

このリポジトリでは、AIアプリケーションをローカルに実行できるツールキットであるRunAnywhere-sdksを提供しています。

自然言語処理大規模言語モデル
用途
AIアプリケーションをローカルに実行できるツールキット
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

lance — Open Lakehouse Format for Multimodal AI. Convert from Parquet in 2 lines of code for 100x faster random access, vector index, and data versioning. Compatible with Pandas, DuckDB, Polars, Pyarrow, and PyTorch with more integrations coming..

マルチモーダルAIに適したオープンレイクハウスフォーマットです。このフォーマットでは、パレットからデータを2行のコードで変換することができ、100倍速くなります。また、ベクトルインデックスやデータバージョニングが可能です

自然言語処理大規模言語モデルマルチモーダル
用途
オープンレイクハウスフォーマット
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

agent-starter-pack — Ship AI Agents to Google Cloud in minutes, not months. Production-ready templates with built-in CI/CD, evaluation, and observability.

AIエージェントをGoogle Cloudに展開することが可能で、CI/CD、評価、観察など、プロダクションリードテンプレートが事前に用意されています。

自然言語処理大規模言語モデル生成
用途
AIエージェントをGoogle Cloudに展開
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

kserve — Standardized Distributed Generative and Predictive AI Inference Platform for Scalable, Multi-Framework Deployment on Kubernetes

flyteは、高度に動的で堅牢なAIオーケストレーションプラットフォームであり、データ、モデル、コンピューティングを統合してAIワークフローを作成することができます。

自然言語処理大規模言語モデル生成
用途
エクスペリメントトラッカーを簡単にする
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

unstructured — Convert documents to structured data effortlessly. Unstructured is open-source ETL solution for transforming complex documents into clean, structured formats for language models. Visit our website to learn more about our enterprise grade Platform product for production grade workflows, partitioning, enrichments, chunking and embedding.

ドキュメントを構造化するために使えるオープンソースのETLソリューション。

表形式向き自然言語処理大規模言語モデル画像テキスト表形式
用途
ドキュメントの構造化
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

compromise — modest natural-language processing

この研究では、自然言語処理の負担を減らすモジュラリティを目指しています。モジュラリティとは、システムを小さくて独立した部分に分割して、それぞれを簡素化することです。この研究では、文脈に応じてモジュラリティを変更できるメカ

自然言語処理分類音声
用途
自然言語処理の簡素化
難易度
Easy
コスト
Low
arxivPaper only2026-06-08

An Agency-Transferring Model-Free Policy Enhancement Technique

助け手モデルは、タスクの成果を最大化するために設計されていますが、実際には不適切または不完全な助け手モデルを使用している場合があります。この論文では、元の助け手モデルをRLのトレーニングプロセスに組み込むことで、トレーニ

自然言語処理埋め込み・検索強化学習
用途
助け手モデル改良
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Proxy Reward Internalization and Mechanistic Exploitation: A Learned Precursor to Reward Hacking and Its Generalization

.Proxy RLで培われた知略を分析し、代理報酬内部化と機械的搾取という学習された側面を解明します。モデルはタスク正当性を評価、代理報酬受け入れ予測、そして搾取可能な代理報酬-ゴールドギャップの推論を行うよう学習します

自然言語処理プロンプトエンジニアリング
用途
代理報酬
難易度
Hard
コスト
Medium
arxivPaper only2026-06-08

What the Eyes See, the LLMs Miss: Exploiting Human Perception for Adversarial Text Attacks

大規模言語モデル(LLM)を運用するコンテンツモデレーションシステムは、有害なオンラインコンテンツを防止するために重要な役割を果たします。しかし、これらのシステムの主な目標は単にトークナイズされたテキストを操作することに

自然言語処理大規模言語モデル分類検出画像
用途
文書の分類
難易度
Hard
コスト
High
arxivGitHubあり2026-06-08

Assessing Sample Quality in Conditional Generation under Compositional Shift

Transformerベースのモデルを改良し、ゲノム規制的情報を組み込んだモデルを提案。遺伝情報を組み込むことで、遺伝子発現の解釈と予測の精度が向上することを示した。

MI向き品質予測/異常検知自然言語処理RAG生成
用途
ゲノム規制的情報を組み込んで遺伝子発現の解釈を向上させる
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Now You (Still) See Me: Detecting Evasive Steganographic Payloads in LLMs

最近の研究では、線形プローブを使用して暗示された秘密を内部アクティブ化から回復し、ステラングラフィック侵入の検出を改善しました。しかし、ステラングラフィック侵入を検出し、内部アクティブ化を検知するには、ステラングラフィッ

自然言語処理大規模言語モデル検出テキスト
用途
ステルタグラフィックの侵入検出
難易度
Hard
コスト
High
arxivGitHubあり2026-06-08

Internalizing Geometric Law: Learning from Solver Residuals for Precision-Critical Generation

自然言語から機械設計や技術図案などの正確な構成を作成することができるシステムを開発しました。このシステムは、Geometric Constraintsを満たす正確な構成を作成するために、Constraint DSL (D

自然言語処理大規模言語モデル生成テキスト
用途
機械設計や技術図案の生成
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Orange Lab: Lowering Barriers to Data Mining through Embedded Interactive Workflows

この論文では、data mining におけるビジュアルプログラミングフレームワーク、Orange Lab を提唱しました。これにより、Webベースのデータ分析環境を提供し、ユーザーフェイシングの分析ツールとしてデータ分

MI向き自然言語処理ファインチューニング画像テキスト
用途
データ分析フロー
難易度
Hard
コスト
Medium
arxivPaper only2026-06-08

The Injection Paradox: Brand-Level Suppression in Safety-Trained LLM Recommendations via RAG Context Injection

この論文では、RAG によって安全に訓練されたLLMに攻撃を加えた結果、RAGによって安全に訓練されたLLMの推論が抑制されることを示しています。これは、RAGによって訓練されたLLMが、推論を抑制するために使われたコン

自然言語処理大規模言語モデルテキスト
用途
LLM の安全な推論
難易度
Hard
コスト
High
arxivPaper only2026-06-08

From Shortcuts to Reasoning: Robust Post-Training of Theory of Mind with Reinforcement Learning

理論的思考は、最新の基礎モデルシステムが安全かつ効果的に現実世界で動作するには必須のスキルであると考えられています。しかし、理論的思考の進進には、「ショートカット」問題が存在し、タスクは99%の正解率を達成するのに、ただ

自然言語処理RAGテキストマルチモーダル強化学習
用途
理論的思考の強化問題
難易度
Hard
コスト
High
arxivPaper only2026-06-08

AGENTSERVESIM: A Hardware-aware Simulator for Multi-Turn LLM Agent Serving

LLM間でモデル呼び出しと外部ツールの呼び出しが交互になり、サーバのサーヒングがステートレスの要求処理からステートフルなプログラム実行に移行します。これらのワークロードの評価は、各設計点ごとに専門的なアクセラレータ時間を

自然言語処理大規模言語モデルテキスト
用途
LLMのサーバー処理のためのシミュレータ
難易度
Hard
コスト
High
arxivPaper only2026-06-08

LLM-Orchestrated Conformance Checking in Stroke Care Without Computer-Interpretable Guidelines

医療のガイドラインとの適用を自動的に評価することを目的とするコンフォーマンスチェックフレームワークが開発された。Large Language Models (LLMs) を用いて、コンフォーマンスチェックを実現する。

説明可能自然言語処理大規模言語モデルテキスト
用途
医療におけるガイドラインの適用を支援する
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Steganography Without Modification: Hidden Communication via LLM Seeds

大規模言語モデル(LLM)の推論スタックには、モデルの重み、サンプリングコード、および出力分布を変更することなく、暗号化なしで秘密コミュニケーションを行うステゴグラフィチャンネルが存在する。送信者はシークレットデータを秘

自然言語処理大規模言語モデル生成テキスト
用途
暗号化なし: LLMのシードを使用した秘密のコミュニケーション
難易度
Hard
コスト
High
arxivPaper only2026-06-08

From USD Scenes to Knowledge Graphs: Zero-Shot Ontology Grounding with LLMs

3次元シミュレーションシーンから知識グラフを構築することが、ロボットのタスク推論に重要な役割を果たすが、シーンのオブジェクトを形式的な分類にマッピングするステップが、現実に現れていない。LLMを使用して、このマッピングの

自然言語処理大規模言語モデルテキスト3D
用途
3次元シミュレーションシーンから知識グラフを構築する
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Unveiling Privacy Risks in Multi-modal Large Language Models: Task-specific Vulnerabilities and Mitigation Challenges

大規模言語モデルのプライバシーリスクについては、既に研究が行われていたが、マルチモデル大規模言語モデル(MLLM)のプライバシーリスクについては、まだ十分に調査されていなかった。MLLMでは、テキストだけでなく画像データ

自然言語処理大規模言語モデル画像テキスト
用途
マルチモデル大規模言語モデルにおけるプライバシーリスク
難易度
Hard
コスト
High
arxivPaper only2026-06-08

A Regret Minimization Framework on Preference Learning in Large Language Models

強化学習(RL)では、与えられた問題に対して、正しいアクションを見つけることを目的としたことが多いが、人間のフィードバックから学習する場合、人間の意思決定の選択のための意思決定のフレームワークを構築する必要性から、可否決

自然言語処理大規模言語モデルテキスト強化学習
用途
可能な行動の選択のための意思決定フレームワーク
難易度
Hard
コスト
High
arxivPaper only2026-06-08

LATTEArena: An Evaluation Framework for LLM-powered Tabular Feature Engineering (Extended Version)

LLMがTABULARデータ分析で機能を自動化できるようにした。しかし、標準化されたプラットフォームの欠如は、比較やコスト的評価を行うのを難しくしている。複雑なメソッドの設計により、各コンポーネントの具体的な貢献をはっき

少数データ向き表形式向き自然言語処理大規模言語モデル分類生成回帰
用途
TABULARデータ分析のLLMパラダイムの比較評価
難易度
Hard
コスト
High
arxivPaper only2026-06-08

RTL-BenchLS: A Large-Scale Benchmark for RTL Reasoning and Generation with Large Language Models

LLMベースのRTL生成と推論は、ハードウェア設計自動化の新たな方向を示唆します。しかし、ベンチマークは、大規模化とタスクスコープの制約がある。現存するベンチマークでは、前向きモデルの実績

品質予測/異常検知自然言語処理大規模言語モデル生成テキスト自己教師
用途
RTLリージョニングと生成のための大規模ベンチマーク作成
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Quality-Diversity Search in Sound Generation: Investigating Innovation Engines for Audio Exploration

この研究では、音楽生成における多様性を促進するためのオープンソース・フレームワークを開発します。このフレームワークは、音楽生成における多様性の促進を支援するために、進化的プロセスと多様性促進アルゴリズムを組み合わせたもの

MI向き品質予測/異常検知自然言語処理ファインチューニング分類生成テキスト
用途
音楽生成における多様性の促進
難易度
Hard
コスト
Low
arxivPaper only2026-06-08

Hybrid Metaheuristic Combining the Dragonfly Algorithm and Tabu Search for the Traveling Salesman Problem

この研究では、DragonflyアルゴリズムとTabu Searchを組み合わせたハイブリッドメタ ヘアスティックを提案し、Traveling Salesman問題を解決します。このアルゴリズムは、より早く、より正確に、

品質予測/異常検知自然言語処理RAG
用途
旅行販売マン問題の最適化
難易度
Hard
コスト
Low
arxivPaper only2026-06-08

The Neutral Mask: How RLHF Provides Shallow Alignment while Leaving Partisan Structure Intact in a Large Language Model

この研究では、大規模言語モデルの安全性を評価するためのフレームワーク、PsychoSafe を開発します。このフレームワークは、大規模言語モデルの安全性を評価し、潜在的なリスクを軽減することができます。

自然言語処理大規模言語モデル生成テキスト強化学習
用途
大規模言語モデルの安全性評価
難易度
Hard
コスト
High
arxivPaper only2026-06-08

IS-CoT: Breaking the Long-form Generation Collapse via Interleaved Structural Thinking

この研究では、長文生成モデルの改良を実現するためのフレームワーク、IS-CoT を開発します。このフレームワークは、長文生成モデルの生成性とコントロール性を改善することができます。

品質予測/異常検知自然言語処理大規模言語モデル生成テキスト
用途
長文生成モデルの改良
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Self-Harness: Harnesses That Improve Themselves

LLMベースのエージェントは、環境と連携するハーネスの設計により動作が形作られるが、これらのハーネスは現状ほぼ人間による設計のみである。この研究では、LLMベースのエージェントがハーネスを自ら改善できるメカニズムであるS

自然言語処理大規模言語モデル回帰
用途
LLMのハーネスの自動改善
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Detecting Differences Is Not Understanding Structure: Large Language Models Fail at Graph Isomorphism

この研究では、大きな言語モデルがグラフの同型性を推論できるかどうか調査し、小さなグラフでは同型性を認識できたものの、シードノードラベルを入れ替えてグラフ同型性を検証した結果、同型性が識別されなかった。

自然言語処理大規模言語モデル検出テキスト
用途
グラフの同型性を推論する
難易度
Hard
コスト
High
arxivPaper only2026-06-08

DECSELFMASK: Leveraging Unlabeled Text via Self-Relevance-Guided Masking for Decoder-Only Classification

予備情報が少ない場合や医療分野などの特定の分野の場合、分類タスクは難しいようになるが、この研究では、モデルが未分類データを操作して、分類モデルの性能を向上させる方法である、DecSelfMaskを提案した。

自然言語処理RAG分類生成テキスト
用途
分類タスクの性能向上
難易度
Hard
コスト
High
arxivPaper only2026-06-08

H2HMem: A Multimodal Memory Benchmark for Agents in Human-Human Interactions

大きな言語モデルには記憶や推論機能があるが、ユーザーとの対話におけるこれらの機能の効果はまだ理解されているわけではない。これを受け、この研究では、人間の相互作用、特に会話における記憶と推論能力を評価するためのマルチモーダ

自然言語処理大規模言語モデル生成テキストマルチモーダル
用途
マルチモーダル記憶の評価
難易度
Hard
コスト
High
arxivPaper only2026-06-08

AbstRAG: Learning to Abstract for Retrieval Problems

この研究では、検索タスクにおける抽象レベルにおけるギャップを解消するためのフレームワークであるAbstRAGを提案し、検索タスクにおけるギャップを解消したことで、モデルが検索タスクにおいて正しく情報を開示した。

品質予測/異常検知自然言語処理RAG生成検索テキスト
用途
リトラバージャグによる検索
難易度
Hard
コスト
Low
arxivGitHubあり2026-06-08

MUDIDI: A Two-Stage Framework for Multilingual Dictionary Digitization with Language Models

この研究では、低リソース言語や絶滅言語の辞書のデジタル化が重要であるが、マルチモーダル辞書をデジタル化する方法は今まで難しかったが、この研究では、最近のビジョン言語モデルを用いて辞書のデジタル化が容易になり、辞書内の文字

品質予測/異常検知自然言語処理大規模言語モデル分類セグメンテーションテキスト
用途
ムルティリンガル辞書のデジタル化
難易度
Hard
コスト
High
githubGitHubあり2026-06-08

mxcp — Model eXecution + Context Protocol: Enterprise-Grade Data-to-AI Infrastructure

データをAIに変換する基盤を構築することで、ビジネス上の問題を解決できます。この研究では、Model eXecution + Context ProtocolであるMXCPを提案し、データの変換を簡素化した上で、AIアプ

自然言語処理大規模言語モデルテキスト
用途
データをAIに変換する基盤を構築することによって、ビジネスを改善する
難易度
Easy
コスト
High
githubGitHubあり2026-06-08

ludwig — Low-code framework for building custom LLMs, neural networks, and other AI models

Ludwigは、LLM (Large Language Model) のカスタム化と構築のための低コストフレームワークです。このフレームワークは、ユーザーがカスタム LLM を構築し、トレーニングするのを容易にします。

自然言語処理大規模言語モデル
用途
LLMのカスタム化と構築のための低コストフレームワーク
難易度
Easy
コスト
High
githubGitHubあり2026-06-06

RAG_Techniques — This repository showcases various advanced techniques for Retrieval-Augmented Generation (RAG) systems. Each technique has a detailed notebook tutorial.

医学画像に対する疾患検出モデルを開発し、臨床現場で早期検出と迅速な介入を容易にすることを目的としたフレームワークを提案します。

自然言語処理大規模言語モデル生成
用途
医学画像の疾患検出
難易度
Easy
コスト
High
arxivPaper only2026-06-05

Bradley-Terry Rankings for Recommender Systems Across Dataset Taxonomies

この研究は、データセット特性に関連なくランキング推論アルゴリズムを比較するために、Bradley-Terryランクを提案しています。このアプローチは、データセットを異なる特性に分類し、アルゴリズムをそれぞれの特性に適合さ

品質予測/異常検知自然言語処理RAG
用途
データセット特性に関連なくランキング推論アルゴリズムを比較する
難易度
Hard
コスト
Low
arxivPaper only2026-06-05

QuadVerse: An Integrated Framework Aligning Visual-Physical Reality for Quadruped Simulation

この論文では、四足ロボットのシマイルのためのQuadVerseフレームワークを提案した。QuadVerseは、視覚的、物理的、動的なギャップを考慮したシマイルを用い、四足ロボットの実験環境とシマイルを統合した。

品質予測/異常検知自然言語処理RAG画像動画3D
用途
四足ロボットのシマイル
難易度
Hard
コスト
High
arxivPaper only2026-06-04

Causal Longitudinal Prior-Fitted Networks for Counterfactual Outcome Prediction

この研究では、対象変数が因果関係を持つタイムシリーズに対してカウンターファクタル予測を扱った。この際、カウンターファクタル予測では対象変数を含む時間系列に対して対象変数に対しての因果効果を推定するが、過去の観測値からこれ

センサ/時系列自然言語処理プロンプトエンジニアリングテキスト時系列
用途
カウンターファクタル予測
難易度
Hard
コスト
High
arxivPaper only2026-06-04

MPCoT: Reward-Guided Multi-Path Latent Reasoning for Test-Time Scalable Vision-Language-Action

Vision-Language-Action(バブルラボ、VLアクション)ポリシーが長時間予測と高い不確実性の制御で脆弱であることを認識し、VLアクションポリシーが1パスでのアクションデコードのみを提供し、長時間予測のた

品質予測/異常検知自然言語処理プロンプトエンジニアリングテキストマルチモーダル
用途
long-horizonおよびhigh-uncertainty ControlでのVLAポリシーが脆弱である問題に対する解決策。
難易度
Hard
コスト
High
githubGitHubあり2026-06-03

llm-app — Ready-to-run cloud templates for RAG, AI pipelines, and enterprise search with live data. 🐳Docker-friendly.⚡Always in sync with Sharepoint, Google Drive, S3, Kafka, PostgreSQL, real-time data APIs, and more.

この論文では、RAG、AIパイプライン、企業検索を含むクラウド テンプレートを提供するアプリケーション「llm-app」を紹介します。 llm-app は Docker で動作し、Sharepoint、Google Dr

自然言語処理大規模言語モデル生成
用途
AIパイプラインを構築する
難易度
Easy
コスト
High
arxivPaper only2026-06-02

A Robust Optimization Approach to Sparse Principal Component Analysis

密度関連する主成分分析 (PCA) は、高次元データを対象とする際に効果を発揮しないことがあります。ロバスト最適化アプローチを用いて、スパース主成分分析を対象とする手法を提案しました。

自然言語処理RAG回帰教師なし
用途
スパース主成分分析を対象とするロバスト最適化アプローチ
難易度
Hard
コスト
Low
arxivPaper only2026-06-02

An Asymptotic Theory of Chain-of-Thought in In-Context Learning

この研究は、医療従事者が病気の症状を検出し、診断するのを支援するように設計されています。研究者らは、AIのアルゴリズムを開発し、そのアルゴリズムを臨床試験で検証したところ、AIが医療関係者とほぼ同じレベルの精度で病気の症

自然言語処理大規模言語モデル回帰テキスト
用途
症状の検出と疾患の診断
難易度
Hard
コスト
High
githubGitHubあり2026-05-31

clearml — ClearML - Auto-Magical CI/CD to streamline your AI workload. Experiment Management, Data Management, Pipeline, Orchestration, Scheduling & Serving in one MLOps/LLMOps solution

このリポジトリでは、高スループットと低メモリ消費のLLMインフェレンザエンジンであるVLLMを提供しています。

自然言語処理大規模言語モデル
用途
高スループットと低メモリ消費のLLMインフェレンザ
難易度
Easy
コスト
High
githubGitHubあり2026-05-29

prompt-in-context-learning — Awesome resources for in-context learning and prompt engineering: Mastery of the LLMs such as ChatGPT, GPT-3, and FlanT5, with up-to-date and cutting-edge updates.

このリポジトリはChatGPT、GPT-3、FlanT5などのLLMsの在り方や、in-context learningとprompt engineeringのリソースをまとめたものです。

自然言語処理大規模言語モデルテキスト
用途
LLMマスターへのリソース
難易度
Easy
コスト
High
arxivGitHubあり2026-05-28

PokerSkill: LLMs Can Play Expert-Level Poker without Training or Solvers

ポーカーはIAの代表的な問題です。しかし、強いエキスパートレベルを達成するために、長時間にわたるトレーニングと解釈が必要とされてきました。LLMを使用すると、トレーニングやソルバーが不要となり、ポーカーをプレイすることが

説明可能自然言語処理大規模言語モデルテキスト
用途
ポーカーゲーム
難易度
Hard
コスト
High
githubGitHubあり2026-05-27

Awesome-LM-SSP — A reading list for large models safety, security, and privacy (including Awesome LLM Security, Safety, etc.).

DEFault++は、Transformerアーキテクチャでの内部コンポーネントの不正常な動作を認識するために、3つのレベルでハイエラルキーの学習ベースの診断手法を実装しました。

自然言語処理大規模言語モデル
用途
分析結果やAIモデルへの影響を軽減する
難易度
Easy
コスト
High
githubGitHubあり2026-05-27

memvid — Memory layer for AI Agents. Replace complex RAG pipelines with a serverless, single-file memory layer. Give your agents instant retrieval and long-term memory.

MemVidは、サーバーレスで単一ファイルの記憶層を提案し、AIエージェントが即時検索と長期的な記憶を持つようにする記憶層です。

自然言語処理大規模言語モデル生成テキスト動画
用途
AIエージェントの記憶を管理する
難易度
Easy
コスト
High
arxivPaper only2026-05-26

Why Prompt Optimization Works, and Why It Sometimes Doesn't: A Causal-Inspired Edit-Level Analysis

強化学習を利用し、LLMを最適化するには、適切なパラメータを選択することが重要です。この研究では、強化学習のパラメータがLLMの性能にどのような影響を与えるかを調査し、パラメータを最適化する方法を提案することを目指す。

自然言語処理大規模言語モデルテキスト
用途
強化学習
難易度
Hard
コスト
High
githubGitHubあり2026-05-24

custom-diffusion — Custom Diffusion: Multi-Concept Customization of Text-to-Image Diffusion (CVPR 2023)

CVPR 2023で発表されたCustom Diffusionは、テキストから画像を生成するプロセスをカスタマイズできるDiffusionモデルです。テキストからイメージを生成する際の要件を設定できるので、画像生成の柔軟

自然言語処理ファインチューニング生成画像テキスト
用途
画像生成のカスタマイズ
難易度
Easy
コスト
High
githubGitHubあり2026-05-24

BettaFish — 微舆:人人可用的多Agent舆情分析助手,打破信息茧房,还原舆情原貌,预测未来走向,辅助决策!从0实现,不依赖任何框架。

微舆は人人可用的多Agent舆情分析助手であり、情報茧房を打破して舆情の原貌を還元し、未来の走向を予測し、決策を助けることができます。

自然言語処理大規模言語モデル
用途
舆情分析助手の問題を解決する
難易度
Easy
コスト
High
arxivPaper only2026-05-22

Routing Equilibrium in Mixed-Autonomy Traffic Networks with Altruistic Autonomous Agents

自動車の avanzing を進めることで交通システムへの影響を理解することが注目されているが、混雑しやすくオートナミティと非オートナミティの両方の車両が共存する交通環境を研究する必要がある。混合オートナミティの環境をモ

自然言語処理RAG
用途
混合オートナミティ交通システムの経路設定問題
難易度
Hard
コスト
Low
githubGitHubあり2026-05-22

rasa — 💬 Open source machine learning framework to automate text- and voice-based conversations: NLU, dialogue management, connect to Slack, Facebook, and more - Create chatbots and voice assistants

rasaは、テキストやボイスベースの会話を自動化するオープンソースの機械学習フレームワークです。自然言語理解(NLU)、会話管理、 slackやFacebook等への接続など、幅広い機能を提供しています。

自然言語処理テキスト
用途
チャットボット作成
難易度
Easy
コスト
Medium
arxivPaper only2026-05-21

Vector Policy Optimization: Training for Diversity Improves Test-Time Search

language modelは、現在、novelな環境に一般化することが求められ、推論尺度を伸ばす検索手法であるAlphaEvolveと組み合わせることが求められます。しかし、標準的なparadigmではLLMは、pre

自然言語処理大規模言語モデル生成テキスト
用途
language modelの検索タスクに対応するために多様性を強化する
難易度
Hard
コスト
High
arxivPaper only2026-05-21

Quantum Genetic Optimization for Negative Selection Algorithms in Anomaly Detection

この論文では、アノマリーディテクションにおける負の選択アルゴリズムを最適化するために、量子遺伝アルゴリズムを導入します。这により、検出器の生成効率を向上させることができ、精度も向上します。

品質予測/異常検知自然言語処理ファインチューニング検出生成異常検知
用途
アノマリーディテクションにおける負の選択アルゴリズムの最適化
難易度
Hard
コスト
Medium
githubGitHubあり2026-05-21

deeplake — Deeplake is AI Data Runtime for Agents. It provides serverless postgres with a multimodal datalake, enabling scalable retrieval and training.

自動変換により、モデルはテスト時に計算量を最適化し、難しいステップでより多く計算すると同時に、簡単なステップでより少ない計算を実行します。

自然言語処理大規模言語モデルマルチモーダル
用途
言語モデルに計算量を最適化
難易度
Easy
コスト
High
arxivPaper only2026-05-19

What Do Evolutionary Coding Agents Evolve?

コード生成を進化させるために、最近の研究では LLMs と進化する検索を組み合わせて、タスクに特化したフィードバックを使用してコードを生成、編集、そして選択することを実現している。タスクに特化した評価者でのベストスコアは

自然言語処理大規模言語モデルテキスト
用途
コード生成を進化させる問題を解決する
難易度
Hard
コスト
High
arxivGitHubあり2026-05-19

optimize_anything: A Universal API for Optimizing any Text Parameter

LLM(大規模言語モデル)を利用してテキストパラメータを最適化するシステムを提案しました。このシステムは、単一のシステムでさまざまなタスク(単一タスク、複数タスク、未知の入力など)を実行可能でした。また、システムは、最適

自然言語処理大規模言語モデルテキスト
用途
任意のテキストパラメータを最適化することが可能
難易度
Hard
コスト
High
githubGitHubあり2026-05-19

llama-cookbook — Welcome to the Llama Cookbook! This is your go to guide for Building with Llama: Getting started with Inference, Fine-Tuning, RAG. We also show you how to solve end to end problems using Llama model family and using them on various provider services

LLMモデリングのチュートリアルです。インフェレンスタイム、フィネチュニング、RAGなど、さまざまな機能とサービスの使用方法が解説されています。

自然言語処理大規模言語モデル
用途
LLMアプリケーションの構築
難易度
Easy
コスト
High
arxivPaper only2026-05-15

Domain-Independent Game Abstraction using Word Embedding Techniques

ゲームの抽象化を実現する方法を提案した研究は、ゲームを大きくする要因を削減するために役立つ。しかし従来の方法は、別のゲームに応用する際にゲームごとに分析する必要がある。これは、抽象化を一般化するの難しい原因の1つとなる。

自然言語処理埋め込み・検索テキスト
用途
ゲームの抽象化を実現する
難易度
Hard
コスト
Low
arxivPaper only2026-05-14

Data-Augmented Game Starts for Accelerating Self-Play Exploration in Imperfect Information Games

大規模な不完全情報競争ゲーム(例:スターカフト、ドータ、カウンターストライク)における精査可能な均衡の取得は、sparse rewards と長時間探索のため計算上厄介になっています。この研究では、対手2人ゼロ和(2x0

自然言語処理RAG強化学習
用途
Imperfect Information Games でのSelf-Play探索を加速する
難易度
Hard
コスト
Low
arxivGitHubあり2026-05-07

CoupleEvo: Evolving Heuristics for Coupled Optimization Problems Using Large Language Models

CoupleEvoは、大規模言語モデルを活用したカップルの最適化問題の自動ヒューリスティクーデザインアプローチを提案します。3つの進化的調整戦略が提示されます。

品質予測/異常検知自然言語処理大規模言語モデル生成テキスト
用途
カップルの最適化問題を解決する
難易度
Hard
コスト
High