rllm — Democratizing Reinforcement Learning for LLMs
このリポジトリでは、AIエンジニアリングのためのリソースを提供しています。
- 用途
- AIエンジニアリング
- 難易度
- Easy
- コスト
- High
「reinforcement」の検索結果
17 件このリポジトリでは、AIエンジニアリングのためのリソースを提供しています。
Pythonでマシンラーニングアプリを作成・共有することができるライブラリです。
paperless-ngxは、コミュニティによってサポートされたスーパーチャージドのドキュメント管理システムで、ドキュメントのスキャン・インデックス・アーカイブが可能である。
ゲーム『明日方舟』の支援ツール。全日常のタスクを一括で実行可能。
Gymnasiumは、シングルエージェントRLの疑似環境を提供するAPIです。
ARTは、多段強化学習トレーナーです。このトレーナーは、GRPOを使用して、現実世界のタスクに対して、多段強化学習を行うことができます。
P
この研究では、弾性シミュレーションに基づいて、エピソード間の状態を保つために、リプラスの重みと、エピソードの初期状態を用いました。
Unityを使用してマシンラーニングエージェントを訓練して訓練できるツールです。
医療では、イメージャは単に画像を解釈するのではなく、複数の画像を比較して診断を行うことが多い。しかし、現在の技術ではこのような比較を行うことは困難であるため、メドリコのDBというデータセットを利用することで、医療の比較推
物理ベースのシミュレーションおよびロールアウト学習環境を提供するツールです。
このリポジトリでは、Lecture Learning Modelsに対してReinforcement Learningを実行するライブラリを提供しています。
この論文では、Reinforcement Learning with Human Feedback (RLHF) を元にしたPaLMアーキテクチャの実装を提示します。基本的にChatGPTのようなLLMですが、PaLMと
Mathematical Foundations of Reinforcement Learningは、ディープラーニングにおける推論力学習の数学的基礎を網羅している。
強化学習に関する学習教室を提供するリポジトリです。
ゲームの一般的な強化学習用エンドポインティであるEnvironmentおよびアルゴリズムの集合。
人工知能による画像水印除去ツールとライブラリを提供する。