sklearn baseline and roberta-large update

2026-04-10 12:33:42 +00:00 · 2024-08-26 10:31:54 +02:00
parent 4f791e6cc2
commit 91cdfe3309
3 changed files with 32 additions and 3 deletions
--- a/ch06/03_bonus_imdb-classification/train_gpt.py
+++ b/ch06/03_bonus_imdb-classification/train_gpt.py
@@ -235,7 +235,14 @@ if __name__ == "__main__":
            "Number of epochs."
        )
    )
-
+    parser.add_argument(
+        "--learning_rate",
+        type=float,
+        default=5e-5,
+        help=(
+            "Learning rate."
+        )
+    )
    args = parser.parse_args()

    if args.trainable_token == "first":
@@ -346,7 +353,7 @@ if __name__ == "__main__":

    start_time = time.time()
    torch.manual_seed(123)
-    optimizer = torch.optim.AdamW(model.parameters(), lr=5e-5, weight_decay=0.1)
+    optimizer = torch.optim.AdamW(model.parameters(), lr=args.learning_rate, weight_decay=0.1)

    train_losses, val_losses, train_accs, val_accs, examples_seen = train_classifier_simple(
        model, train_loader, val_loader, optimizer, device,