DeepSpeed — DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective.
分散トレーニングと推論を容易、効率的に実行するためのディープラーニング最適化ライブラリです。
- 用途
- ディープラーニング最適化ライブラリ
- 難易度
- Easy
- コスト
- High
「最適化」の検索結果
11 件分散トレーニングと推論を容易、効率的に実行するためのディープラーニング最適化ライブラリです。
本論文は、言語モデルの最適化に使用される Hyperparameter Transfer を量化するフレームワークを開発します。このフレームワーフークは、3 つのメトリックスを使用し、そのうちの 1 つは、hyperpa
オープンソースのAI推論最適化と展開用ツールキットです。
TensorZeroは、LLMゲートウェイ、オブザーバビリティ、評価、最適化、実験を統一したオープンソースのLLMOpsプラットフォームです。
このリポジトリでは、トークナイザーの最適化を提供しています。
AutoMegaKernel(AMK)は、Hugging Face Llama-family モデルを単一のパフォーマンスを最適化した CUDA Kernalで動作する単一のPersistent Cooperative
AwesomeOPDはオンPolicy distillationの最適化用リストである。オンPolicy distillationでは、学習済みモデルを小さくすることでモデルを高速化する。
Neural Network Inference用の高性能フレームワークです。モバイルプラットフォームに最適化されています。
自動変換により、モデルはテスト時に計算量を最適化し、難しいステップでより多く計算すると同時に、簡単なステップでより少ない計算を実行します。
LLM(大規模言語モデル)を利用してテキストパラメータを最適化するシステムを提案しました。このシステムは、単一のシステムでさまざまなタスク(単一タスク、複数タスク、未知の入力など)を実行可能でした。また、システムは、最適
CoupleEvoは、大規模言語モデルを活用したカップルの最適化問題の自動ヒューリスティクーデザインアプローチを提案します。3つの進化的調整戦略が提示されます。