NikiBase
/

BLOOM-LORA-v1.0.0

Transformers

PyTorch

Model card Files Files and versions

xet

Community

NikiBase commited on May 11, 2023

Commit

80fe108

1 Parent(s): ba860a8

Upload config.json

Browse files

Files changed (1) hide show

config.json +356 -0

config.json ADDED Viewed

	@@ -0,0 +1,356 @@

+{
+  "best_metric": 1.4986101388931274,
+  "best_model_checkpoint": "BLOOM-alpaca",
+  "epoch": 2.5628704148646486,
+  "global_step": 1000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "learning_rate": 5.9999999999999995e-05,
+      "loss": 3.799,
+      "step": 20
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 0.00011999999999999999,
+      "loss": 3.1924,
+      "step": 40
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 0.00017999999999999998,
+      "loss": 2.1651,
+      "step": 60
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 0.00023999999999999998,
+      "loss": 1.7068,
+      "step": 80
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 0.0003,
+      "loss": 1.6352,
+      "step": 100
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 0.00029439252336448596,
+      "loss": 1.5979,
+      "step": 120
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.00028878504672897194,
+      "loss": 1.5722,
+      "step": 140
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 0.0002831775700934579,
+      "loss": 1.5735,
+      "step": 160
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 0.0002775700934579439,
+      "loss": 1.5481,
+      "step": 180
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 0.0002719626168224299,
+      "loss": 1.5288,
+      "step": 200
+    },
+    {
+      "epoch": 0.51,
+      "eval_loss": 1.5642188787460327,
+      "eval_runtime": 117.512,
+      "eval_samples_per_second": 17.02,
+      "eval_steps_per_second": 2.127,
+      "step": 200
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.00026635514018691586,
+      "loss": 1.5394,
+      "step": 220
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 0.00026074766355140184,
+      "loss": 1.5299,
+      "step": 240
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 0.0002551401869158878,
+      "loss": 1.5137,
+      "step": 260
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 0.0002495327102803738,
+      "loss": 1.5199,
+      "step": 280
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 0.0002439252336448598,
+      "loss": 1.5171,
+      "step": 300
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 0.00023831775700934577,
+      "loss": 1.5143,
+      "step": 320
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 0.00023271028037383175,
+      "loss": 1.5053,
+      "step": 340
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 0.00022710280373831773,
+      "loss": 1.5078,
+      "step": 360
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 0.0002214953271028037,
+      "loss": 1.5003,
+      "step": 380
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 0.0002158878504672897,
+      "loss": 1.5004,
+      "step": 400
+    },
+    {
+      "epoch": 1.03,
+      "eval_loss": 1.5298347473144531,
+      "eval_runtime": 117.6931,
+      "eval_samples_per_second": 16.993,
+      "eval_steps_per_second": 2.124,
+      "step": 400
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 0.00021028037383177567,
+      "loss": 1.4853,
+      "step": 420
+    },
+    {
+      "epoch": 1.13,
+      "learning_rate": 0.00020467289719626166,
+      "loss": 1.511,
+      "step": 440
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 0.00019906542056074764,
+      "loss": 1.4976,
+      "step": 460
+    },
+    {
+      "epoch": 1.23,
+      "learning_rate": 0.00019345794392523362,
+      "loss": 1.4804,
+      "step": 480
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 0.0001878504672897196,
+      "loss": 1.4795,
+      "step": 500
+    },
+    {
+      "epoch": 1.33,
+      "learning_rate": 0.00018224299065420558,
+      "loss": 1.4876,
+      "step": 520
+    },
+    {
+      "epoch": 1.38,
+      "learning_rate": 0.00017663551401869156,
+      "loss": 1.4791,
+      "step": 540
+    },
+    {
+      "epoch": 1.44,
+      "learning_rate": 0.00017102803738317754,
+      "loss": 1.4903,
+      "step": 560
+    },
+    {
+      "epoch": 1.49,
+      "learning_rate": 0.00016542056074766352,
+      "loss": 1.4817,
+      "step": 580
+    },
+    {
+      "epoch": 1.54,
+      "learning_rate": 0.0001598130841121495,
+      "loss": 1.5033,
+      "step": 600
+    },
+    {
+      "epoch": 1.54,
+      "eval_loss": 1.513887882232666,
+      "eval_runtime": 118.2404,
+      "eval_samples_per_second": 16.915,
+      "eval_steps_per_second": 2.114,
+      "step": 600
+    },
+    {
+      "epoch": 1.59,
+      "learning_rate": 0.0001542056074766355,
+      "loss": 1.4738,
+      "step": 620
+    },
+    {
+      "epoch": 1.64,
+      "learning_rate": 0.00014859813084112147,
+      "loss": 1.4903,
+      "step": 640
+    },
+    {
+      "epoch": 1.69,
+      "learning_rate": 0.00014299065420560745,
+      "loss": 1.4982,
+      "step": 660
+    },
+    {
+      "epoch": 1.74,
+      "learning_rate": 0.00013738317757009343,
+      "loss": 1.4773,
+      "step": 680
+    },
+    {
+      "epoch": 1.79,
+      "learning_rate": 0.0001317757009345794,
+      "loss": 1.4663,
+      "step": 700
+    },
+    {
+      "epoch": 1.85,
+      "learning_rate": 0.0001261682242990654,
+      "loss": 1.478,
+      "step": 720
+    },
+    {
+      "epoch": 1.9,
+      "learning_rate": 0.00012056074766355139,
+      "loss": 1.4548,
+      "step": 740
+    },
+    {
+      "epoch": 1.95,
+      "learning_rate": 0.00011495327102803737,
+      "loss": 1.4928,
+      "step": 760
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 0.00010934579439252335,
+      "loss": 1.4769,
+      "step": 780
+    },
+    {
+      "epoch": 2.05,
+      "learning_rate": 0.00010373831775700933,
+      "loss": 1.4553,
+      "step": 800
+    },
+    {
+      "epoch": 2.05,
+      "eval_loss": 1.5058649778366089,
+      "eval_runtime": 117.6034,
+      "eval_samples_per_second": 17.006,
+      "eval_steps_per_second": 2.126,
+      "step": 800
+    },
+    {
+      "epoch": 2.1,
+      "learning_rate": 9.813084112149531e-05,
+      "loss": 1.4699,
+      "step": 820
+    },
+    {
+      "epoch": 2.15,
+      "learning_rate": 9.25233644859813e-05,
+      "loss": 1.4596,
+      "step": 840
+    },
+    {
+      "epoch": 2.2,
+      "learning_rate": 8.691588785046728e-05,
+      "loss": 1.4786,
+      "step": 860
+    },
+    {
+      "epoch": 2.26,
+      "learning_rate": 8.130841121495326e-05,
+      "loss": 1.4701,
+      "step": 880
+    },
+    {
+      "epoch": 2.31,
+      "learning_rate": 7.570093457943924e-05,
+      "loss": 1.4608,
+      "step": 900
+    },
+    {
+      "epoch": 2.36,
+      "learning_rate": 7.009345794392522e-05,
+      "loss": 1.47,
+      "step": 920
+    },
+    {
+      "epoch": 2.41,
+      "learning_rate": 6.44859813084112e-05,
+      "loss": 1.4593,
+      "step": 940
+    },
+    {
+      "epoch": 2.46,
+      "learning_rate": 5.887850467289719e-05,
+      "loss": 1.4566,
+      "step": 960
+    },
+    {
+      "epoch": 2.51,
+      "learning_rate": 5.327102803738317e-05,
+      "loss": 1.4624,
+      "step": 980
+    },
+    {
+      "epoch": 2.56,
+      "learning_rate": 4.766355140186915e-05,
+      "loss": 1.4484,
+      "step": 1000
+    },
+    {
+      "epoch": 2.56,
+      "eval_loss": 1.4986101388931274,
+      "eval_runtime": 117.7967,
+      "eval_samples_per_second": 16.978,
+      "eval_steps_per_second": 2.122,
+      "step": 1000
+    }
+  ],
+  "max_steps": 1170,
+  "num_train_epochs": 3,
+  "total_flos": 5.959000367982182e+16,
+  "trial_name": null,
+  "trial_params": null
+}