Learning to Attack and Defend: Adaptive Red Teaming of Language Models via GRPO
AIリードチームは、進化する攻撃者と防御者に対処するために、継続的対応が必要です。強化学習を使うと、新しい攻撃を探し出すことができ、同時に強化学習を使って防御を強化することもできます。新しいフレームワークAdvGRPOは
- 用途
- 攻撃の応答
- 難易度
- Hard
- コスト
- High
「最適化」の検索結果
35 件AIリードチームは、進化する攻撃者と防御者に対処するために、継続的対応が必要です。強化学習を使うと、新しい攻撃を探し出すことができ、同時に強化学習を使って防御を強化することもできます。新しいフレームワークAdvGRPOは
AutoMegaKernel(AMK)は、Hugging Face Llama-family モデルを単一のパフォーマンスを最適化した CUDA Kernalで動作する単一のPersistent Cooperative
オンライン学習の継続学習では、モデルは非駅性データ ストリームから知識を継続的に蓄積する必要があります。モデルのパラメータはトレーニング中に効果的に調整される必要がありますが、パラメータ効率的なプロンプト チューニングや
これは、不確実性やリスクを減らすために、$\rho$-NPTS (Nonparametric Thompson Sampling) というアレイフリーの非パラメトリックベースのThompson Samplingで、リスク
Alcmean's アルゴリズムは、複雑なネットワークの分析において基本的な問題であるコミュニティ検出に取り組んでいます。従来のアルゴリズムはマニュアルなパラメータ調整を必要としており、中心の選択も不正確です。この課題を
分析モデルを新しいアームが現れる環境でアップデートすることで、最適なアームを選択できるようになります。
モジュラー演算を使用することで、メモリを最適に利用することができるようになり、パフォーマンスの向上につながります。
スライディングウィンドウのマルチアームバンドットでのパフォーマンスを最適化するために、アルゴリズムを提案します。
巨大なAIデータセンターは、電力系統のプランニングや運用において構造的に大きな課題を引き起こします。21つのAI成長シナリオを含むヨーロッパの空間的explicitな最適化モデルを使用して、DCsの追加電力需要、容量要件
この研究では、DragonflyアルゴリズムとTabu Searchを組み合わせたハイブリッドメタ ヘアスティックを提案し、Traveling Salesman問題を解決します。このアルゴリズムは、より早く、より正確に、
この研究では、ローカルサーチを使用してグラフカラー化を最適化します。この研究では、ローカルサーチの能力をグラフカラー化に適用し、より効率的にグラフをカラーリングすることができます。
この研究では、CMA-ESアルゴリズムの停止条件を評価します。この研究では、CMA-ESアルゴリズムの停止条件が機能するかどうかを調べ、アルゴリズムを改良するための情報を提供します。
この論文では、水上ロボットの設計の高速化のための新しい方法を提案した。Gaussian Evolutionary Specialists(GES)を用いた設計システムを用い、ロボットの形状と制御を同時に最適化することがで
この論文では、自動運転のためのトラッキング最適化を実現した。TOAD(Trajectory Optimization And Dynamics)は、最適化を用いて、トラッキングを最適化するための新しいフレームワークを提案
車の乗り心地と移動効率の同時最適化を可能にするためのローカル方程式に基づく車の乗り心地と移動効率の同時最適化方法を提案した。
Deep Learningモデルのパラメータの最適化には、テスト時パフォーマンスを最適化することが重要なステップで、しかし、従来のアルゴリズムでは、テスト時パフォーマンスを最適化することは困難である。Double Pre
この研究では、L-SDPPO という方法を提案します。これは、連携型ロボット Manipulation に向けたディフュージョン ポリシーの最適化を実現するものです。
ラジアル基底関数ニューラルネットをトレーニングするために、パートクレ-swarm最適化を使用する方法を提案する。
都市計画を最適化するために、クオリティ-ダイバーシティ最適化を使用する方法を提案する。
パラメータの最適化を目的としたオフライン-MOOアルゴリズムを提案する。
SVRモデルの中で、特定の目的関数の最適化に応用できる、DC法を適用する手法を提案しました。具体的には、 DCの構造を分析し、それを適用することで、最適化のプロセスが改善されます。
密度関連する主成分分析 (PCA) は、高次元データを対象とする際に効果を発揮しないことがあります。ロバスト最適化アプローチを用いて、スパース主成分分析を対象とする手法を提案しました。
強化学習を利用し、LLMを最適化するには、適切なパラメータを選択することが重要です。この研究では、強化学習のパラメータがLLMの性能にどのような影響を与えるかを調査し、パラメータを最適化する方法を提案することを目指す。
この研究では、動的複合目的最適化のための基準テストスイートの開発に関する問題を解決するために、この問題のための基準テストスイートを設計した。研究によって、この基準テストスイートは既存の基準テストスイートに比べて大幅によか
language modelは、現在、novelな環境に一般化することが求められ、推論尺度を伸ばす検索手法であるAlphaEvolveと組み合わせることが求められます。しかし、標準的なparadigmではLLMは、pre
この論文では、アノマリーディテクションにおける負の選択アルゴリズムを最適化するために、量子遺伝アルゴリズムを導入します。这により、検出器の生成効率を向上させることができ、精度も向上します。
この研究では、トランスファーマーをベースにした変換の方法を使用することで、Cartesian遺伝的プログラミング (CGP) を使用してニュルアルネットワークの設計の最適化方法が改善されました。この研究では、トランスファ
この研究では、混合整数最適化の進化戦略に基づくオブジェクト関数の近似精度を確保するためのアプローチを示します。従来の進化戦略では、選択された座標の整数変数の標準偏差に下限を設けて、整数変数の収束を防ぐことが一般的です。こ
LLM(大規模言語モデル)を利用してテキストパラメータを最適化するシステムを提案しました。このシステムは、単一のシステムでさまざまなタスク(単一タスク、複数タスク、未知の入力など)を実行可能でした。また、システムは、最適
スパイク型ニューラルネットワーク(SNN)は生物学的信号の模倣であり、電気信号によって情報を伝達し、計算の最適化を行います。この研究では、ニューロン間の信号伝達をスパイク信号で表現するスパイク型ニューラルネットワークのた
連続関数を最適化するには、多くの研究者がDE(Differential Evolution)を用いて問題を解決したことが知られています。しかし、RE(Quaternion Number Representation)を用
再帰的ネットワークは複雑なプロセッサを持つため、最適化は難しい。計算資源に制限がある場合、パラメータを分配する際のバランスを取る必要がある。
Towards Affordable Energyは、電力需要応答プログラムの最適化に役立つアルゴリズムを紹介する研究である。
高価な制約付き多目的最適化問題のためのメタ黒箱最適化フレームワークを提案し、低コストな計算リソースで最適解を見つけることができます。
CoupleEvoは、大規模言語モデルを活用したカップルの最適化問題の自動ヒューリスティクーデザインアプローチを提案します。3つの進化的調整戦略が提示されます。