You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
 
 
 
Vladimir 38a19a32bd prepend function is unnecessary when it is used once 10 months ago
checkpoints update 12 months ago
data update 11 months ago
logs added padding mask 10 months ago
src prepend function is unnecessary when it is used once 10 months ago
.dockerignore IC 12 months ago
.gitattributes IC 12 months ago
.gitignore IC 12 months ago
Dockerfile IC 12 months ago
build.sh IC 12 months ago
readme.md added padding mask 10 months ago
start.sh IC 12 months ago

readme.md

Скрипты для обучения bert предсказанию кредитного дефолта по данным кредитных историй

https://ods.ai/competitions/dl-fintech-bki

# single gpu версия
python src/bert_training.py fold3_18l_dyt_04_04_3750
# data parallel версия 
CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 python src/bert_training_dp.py fold3_18l_dyt_04_04_3750
# distributed data parallel версия 
CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 torchrun --standalone --nproc-per-node=8 src/bert_training_ddp.py fold3_18l_dyt_04_04_3750

Логирование ведётся в tensorboard в папку ./logs/. В папку с логами при запуске копируется текущая версия скрипта. Чекпоинты моделей сохраняются в папку ./checkpoints/.

Разбиение на обучающую и тестовую выборки осуществляется скриптом train_test_split.py.