トレーニングプログラムで複数のプロセスを使用する場合は、Documentation Index
Fetch the complete documentation index at: https://wb-21fd5541-john-wbdocs-2044-rename-serverless-products.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
wandb.init() を実行していないプロセスから wandb の method を呼び出さないようにプログラムを構成してください。
マルチプロセスのトレーニングは、次の方法で管理できます。
- すべてのプロセスで
wandb.initを呼び出し、group キーワード引数を使用して共有グループを作成します。各プロセスはそれぞれ独自の wandb run を持ち、UI ではそれらのトレーニングプロセスがグループ化されて表示されます。 - 1 つのプロセスでのみ
wandb.initを呼び出し、ログするデータを multiprocessing queues 経由で渡します。
これらの方法の詳細な説明については、Torch DDP を使ったコード例を含む Distributed Training Guide を参照してください。
Experiments