Merge pull request 'removed newline during test output' (#2) from traindiag into main

Reviewed-on: #2
1 month ago · 56ad50d27a
parent b8ee7f43cd df9b224c18
commit 56ad50d27a
22 changed files with 0 additions and 44 deletions
--- a/src/train_char_gpt2_128.py
+++ b/src/train_char_gpt2_128.py
@ -221,8 +221,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_char_gpt2_256.py
+++ b/src/train_char_gpt2_256.py
@ -221,8 +221,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_char_gpt2_512.py
+++ b/src/train_char_gpt2_512.py
@ -221,8 +221,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_char_gpt2_64.py
+++ b/src/train_char_gpt2_64.py
@ -221,8 +221,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_char_gpt2_koef_128.py
+++ b/src/train_char_gpt2_koef_128.py
@ -223,8 +223,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_char_gpt2_koef_256.py
+++ b/src/train_char_gpt2_koef_256.py
@ -223,8 +223,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_char_gpt2_koef_512.py
+++ b/src/train_char_gpt2_koef_512.py
@ -223,8 +223,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_char_gpt2_koef_64.py
+++ b/src/train_char_gpt2_koef_64.py
@ -223,8 +223,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_optics_char_gpt2_128.py
+++ b/src/train_optics_char_gpt2_128.py
@ -327,8 +327,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_optics_char_gpt2_256.py
+++ b/src/train_optics_char_gpt2_256.py
@ -327,8 +327,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_optics_char_gpt2_512.py
+++ b/src/train_optics_char_gpt2_512.py
@ -327,8 +327,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_optics_char_gpt2_64.py
+++ b/src/train_optics_char_gpt2_64.py
@ -327,8 +327,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_optics_char_gpt2_ff.py
+++ b/src/train_optics_char_gpt2_ff.py
@ -326,8 +326,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_optics_char_gpt2_nokoef_128.py
+++ b/src/train_optics_char_gpt2_nokoef_128.py
@ -325,8 +325,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_optics_char_gpt2_nokoef_256.py
+++ b/src/train_optics_char_gpt2_nokoef_256.py
@ -325,8 +325,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_optics_char_gpt2_nokoef_512.py
+++ b/src/train_optics_char_gpt2_nokoef_512.py
@ -325,8 +325,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_optics_char_gpt2_nokoef_64.py
+++ b/src/train_optics_char_gpt2_nokoef_64.py
@ -325,8 +325,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_optics_trainable_focal_dist_lens_64.py
+++ b/src/train_optics_trainable_focal_dist_lens_64.py
@ -343,8 +343,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################
--- a/src/train_optics_trainable_lens_128.py
+++ b/src/train_optics_trainable_lens_128.py
@ -341,8 +341,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_optics_trainable_lens_256.py
+++ b/src/train_optics_trainable_lens_256.py
@ -341,8 +341,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_optics_trainable_lens_512.py
+++ b/src/train_optics_trainable_lens_512.py
@ -341,8 +341,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################mo
--- a/src/train_optics_trainable_lens_64.py
+++ b/src/train_optics_trainable_lens_64.py
@ -341,8 +341,6 @@ def perplexity(model, data, batch_size=32):
        # Progress update
        processed = min(i + batch_size, total_sequences)
        print(f"\rppl {processed}/{total_sequences} ({processed/total_sequences*100:.1f}%)", end="", flush=True)
    print()  # Final newline
    return np.exp(total_loss_sum / total_tokens_count)
 #################################### Model #########################################