From fd482cc5594b18d2f8f1108defc49ad1c6776a8f Mon Sep 17 00:00:00 2001 From: Vladimir Date: Sat, 5 Apr 2025 17:04:14 +0400 Subject: [PATCH] update --- readme.md | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/readme.md b/readme.md index beea2b6..f84828a 100644 --- a/readme.md +++ b/readme.md @@ -8,9 +8,9 @@ python src/bert_training.py fold3_18l_dyt_04_04_3750 # data parallel версия CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 python src/bert_training_dp.py fold3_18l_dyt_04_04_3750 # distributed data parallel версия -CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 torchrun --standalone --nproc-per-node=8 bert_training_ddp.py fold3_18l_dyt_04_04_3750 +CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 torchrun --standalone --nproc-per-node=8 src/bert_training_ddp.py fold3_18l_dyt_04_04_3750 ``` Логирование ведётся в tensorboard в папку `./runs/`. В папку с логами при запуске копируется текущая версия скрипта. Чекпоинты моделей сохраняются в папку `./checkpoints/`. -Разбиение на обучающую и тестовую выборки осуществляется скриптом `train_test_split.py`. \ No newline at end of file +Разбиение на обучающую и тестовую выборки осуществляется скриптом `train_test_split.py`.