sgraham
/

modernbert-llm-cidoc-crm

@@ -4,8 +4,6 @@ license: apache-2.0
 base_model: answerdotai/ModernBERT-base
 tags:
 - generated_from_trainer
-metrics:
-- f1
 model-index:
 - name: modernbert-llm-cidoc-crm
   results: []
@@ -17,9 +15,6 @@ should probably proofread and complete it, then remove this comment. -->
 # modernbert-llm-cidoc-crm
 This model is a fine-tuned version of [answerdotai/ModernBERT-base](https://huggingface.co/answerdotai/ModernBERT-base) on the None dataset.
-It achieves the following results on the evaluation set:
-- Loss: 5.4123
-- F1: 0.0
 ## Model description
@@ -38,7 +33,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 5e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
@@ -46,22 +41,11 @@ The following hyperparameters were used during training:
 - total_train_batch_size: 64
 - optimizer: Use adamw_torch_fused with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 10
 ### Training results
-| Training Loss | Epoch  | Step | Validation Loss | F1  |
-|:-------------:|:------:|:----:|:---------------:|:---:|
-| No log        | 0.5714 | 1    | 4.9327          | 0.0 |
-| No log        | 1.5714 | 2    | 5.0024          | 0.0 |
-| No log        | 2.5714 | 3    | 5.0481          | 0.0 |
-| No log        | 3.5714 | 4    | 5.1106          | 0.0 |
-| No log        | 4.5714 | 5    | 5.1695          | 0.0 |
-| No log        | 5.5714 | 6    | 5.2392          | 0.0 |
-| No log        | 6.5714 | 7    | 5.2945          | 0.0 |
-| No log        | 7.5714 | 8    | 5.3534          | 0.0 |
-| No log        | 8.5714 | 9    | 5.3930          | 0.0 |
-| No log        | 9.5714 | 10   | 5.4123          | 0.0 |
 ### Framework versions

 base_model: answerdotai/ModernBERT-base
 tags:
 - generated_from_trainer
 model-index:
 - name: modernbert-llm-cidoc-crm
   results: []
 # modernbert-llm-cidoc-crm
 This model is a fine-tuned version of [answerdotai/ModernBERT-base](https://huggingface.co/answerdotai/ModernBERT-base) on the None dataset.
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 1e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 - total_train_batch_size: 64
 - optimizer: Use adamw_torch_fused with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.1
 - num_epochs: 10
 ### Training results
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dae5b845e137f8c3713c3ca737597fe7d49badc29f45578b3a7fb4a2184868b1
 size 598824292

 version https://git-lfs.github.com/spec/v1
+oid sha256:c0a8ce6c8cae97af580d43a47a08480128d4a23b7cf38a773460be8398f1ed36
 size 598824292

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b8a5e300df48c6f5de8d6a74016ff67990c4514dd7e57ba8ddcfe90cae73e5e2
 size 5304

 version https://git-lfs.github.com/spec/v1
+oid sha256:ff4883c458a9dad07b75b0fe0dbc00d1aa75911ade1dda3bc6320ad8699cb144
 size 5304