Topic

LLM Fine-tuningの論文・実装まとめ

LoRA、RLHF、SFT、軽量ファインチューニングなど、LLMを用途に合わせる技術を扱います。

まず見るべき実装候補

520 articles

新着記事

githubGitHubあり2026-06-09

wandb — The AI developer platform. Use Weights & Biases to train and fine-tune models, and manage models from experimentation to production.

Weights & Biasesは、AI開発を支援するプラットフォームです。このプラットフォームは、モデル開発から生産準備までを支援し、コストをコントロールし、モデルとデータへのアクセスを管理します。

自然言語処理ファインチューニング
用途
AI開発プラットフォーム
難易度
Easy
コスト
Medium
githubGitHubあり2026-06-09

prompts.chat — f.k.a. Awesome ChatGPT Prompts. Share, discover, and collect prompts from the community. Free and open source — self-host for your organization with complete privacy.

prompts.chatは、コミュニティが共有したChatGPT用のプロンプットを発見・収集できる場所で、無料でオープンソースで提供されている。

自然言語処理大規模言語モデル
用途
チャットGPT用のプロンプトを共有
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

unsloth — Unsloth Studio is a web UI for training and running open models like Gemma 4, Qwen3.6, DeepSeek, gpt-oss locally.

Unsloth Studioは、オープンモデルのトレーニングと実行を支援するWebUIです。このライブラリは、Gemma4、Qwen3.5などのオープンモデルのテストとトレーニングを支援するために使われます。

自然言語処理大規模言語モデルテキスト音声
用途
オープンモデルのトレーニングと実行
難易度
Easy
コスト
High
githubGitHubあり2026-06-09

ART — Agent Reinforcement Trainer: train multi-step agents for real-world tasks using GRPO. Give your agents on-the-job training. Reinforcement learning for Qwen3.6, GPT-OSS, Llama, and more!

ARTは、多段強化学習トレーナーです。このトレーナーは、GRPOを使用して、現実世界のタスクに対して、多段強化学習を行うことができます。

自然言語処理大規模言語モデル強化学習
用途
多段強化学習トレーナー
難易度
Easy
コスト
High