new tune hindi text

Files changed (9) hide show

config.json +1 -1
generation_config.json +1 -1
model.safetensors +1 -1
output_tune.log +68 -0
special_tokens_map.json +24 -0
test_output.txt +56 -0
tokenizer.json +0 -0
tokenizer_config.json +30 -0
vocab.json +0 -0

config.json CHANGED Viewed

@@ -32,7 +32,7 @@
     }
   },
   "torch_dtype": "float32",
-  "transformers_version": "4.54.1",
   "use_cache": true,
   "vocab_size": 50257
 }

     }
   },
   "torch_dtype": "float32",
+  "transformers_version": "4.55.4",
   "use_cache": true,
   "vocab_size": 50257
 }

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
-  "transformers_version": "4.54.1"
 }

   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
+  "transformers_version": "4.55.4"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:83276c7135dc7f802bd364631db2610bff770ba86843e03920953da6c410c3f3
 size 497774208

 version https://git-lfs.github.com/spec/v1
+oid sha256:05421fc15f3404fbca310ba45a596bd1228801d441147cd4db74eacce823654e
 size 497774208

output_tune.log ADDED Viewed

	@@ -0,0 +1,68 @@

+( gpt2_env1) mainakjsr@mainakjsr-Lenovo-Y50-70-Touch:~/py_projects/shayari1$ python3 gpt2_tunning.py
+Starting fine-tuning...
+  0%|                                                                                                                                                           | 0/600 [00:00<?, ?it/s]`loss_type=None` was set in the config but it is unrecognised.Using the default loss: `ForCausalLMLoss`.
+{'loss': 0.0181, 'grad_norm': 2.293494462966919, 'learning_rate': 4.9250000000000004e-05, 'epoch': 0.1}
+{'loss': 0.0115, 'grad_norm': 0.5815603137016296, 'learning_rate': 4.8416666666666673e-05, 'epoch': 0.2}
+{'loss': 0.029, 'grad_norm': 2.7110595703125, 'learning_rate': 4.7583333333333336e-05, 'epoch': 0.3}
+{'loss': 0.0209, 'grad_norm': 0.7257663607597351, 'learning_rate': 4.6750000000000005e-05, 'epoch': 0.4}
+{'loss': 0.0076, 'grad_norm': 0.20155230164527893, 'learning_rate': 4.591666666666667e-05, 'epoch': 0.5}
+{'loss': 0.0258, 'grad_norm': 2.0846869945526123, 'learning_rate': 4.5083333333333336e-05, 'epoch': 0.6}
+{'loss': 0.0299, 'grad_norm': 0.3581019341945648, 'learning_rate': 4.4250000000000005e-05, 'epoch': 0.7}
+{'loss': 0.0174, 'grad_norm': 1.6799453496932983, 'learning_rate': 4.341666666666667e-05, 'epoch': 0.8}
+{'loss': 0.0248, 'grad_norm': 1.8864364624023438, 'learning_rate': 4.2583333333333336e-05, 'epoch': 0.9}
+{'loss': 0.0199, 'grad_norm': 0.7106167674064636, 'learning_rate': 4.175e-05, 'epoch': 1.0}
+{'loss': 0.0129, 'grad_norm': 1.9354057312011719, 'learning_rate': 4.091666666666667e-05, 'epoch': 1.1}
+{'loss': 0.0189, 'grad_norm': 2.191124439239502, 'learning_rate': 4.0083333333333336e-05, 'epoch': 1.2}
+{'loss': 0.0356, 'grad_norm': 0.24308550357818604, 'learning_rate': 3.9250000000000005e-05, 'epoch': 1.3}
+{'loss': 0.0121, 'grad_norm': 0.4473109543323517, 'learning_rate': 3.841666666666667e-05, 'epoch': 1.4}
+{'loss': 0.0257, 'grad_norm': 3.0310373306274414, 'learning_rate': 3.7583333333333337e-05, 'epoch': 1.5}
+{'loss': 0.0243, 'grad_norm': 0.40297117829322815, 'learning_rate': 3.675e-05, 'epoch': 1.6}
+{'loss': 0.0199, 'grad_norm': 0.20001010596752167, 'learning_rate': 3.591666666666667e-05, 'epoch': 1.7}
+{'loss': 0.0092, 'grad_norm': 1.5069109201431274, 'learning_rate': 3.508333333333334e-05, 'epoch': 1.8}
+{'loss': 0.0302, 'grad_norm': 1.6387602090835571, 'learning_rate': 3.4250000000000006e-05, 'epoch': 1.9}
+{'loss': 0.0193, 'grad_norm': 2.052999258041382, 'learning_rate': 3.341666666666667e-05, 'epoch': 2.0}
+{'loss': 0.0202, 'grad_norm': 0.5691620111465454, 'learning_rate': 3.258333333333333e-05, 'epoch': 2.1}
+{'loss': 0.0237, 'grad_norm': 0.829046368598938, 'learning_rate': 3.175e-05, 'epoch': 2.2}
+{'loss': 0.0206, 'grad_norm': 0.6925863027572632, 'learning_rate': 3.091666666666667e-05, 'epoch': 2.3}
+{'loss': 0.0159, 'grad_norm': 1.1066631078720093, 'learning_rate': 3.0083333333333337e-05, 'epoch': 2.4}
+{'loss': 0.0221, 'grad_norm': 0.5353291630744934, 'learning_rate': 2.925e-05, 'epoch': 2.5}
+{'loss': 0.0114, 'grad_norm': 0.7897487282752991, 'learning_rate': 2.841666666666667e-05, 'epoch': 2.6}
+{'loss': 0.0179, 'grad_norm': 2.496028184890747, 'learning_rate': 2.7583333333333334e-05, 'epoch': 2.7}
+{'loss': 0.0155, 'grad_norm': 2.1950201988220215, 'learning_rate': 2.6750000000000003e-05, 'epoch': 2.8}
+{'loss': 0.0204, 'grad_norm': 1.5243595838546753, 'learning_rate': 2.5916666666666665e-05, 'epoch': 2.9}
+{'loss': 0.0195, 'grad_norm': 0.7217574119567871, 'learning_rate': 2.5083333333333338e-05, 'epoch': 3.0}
+{'loss': 0.0176, 'grad_norm': 1.0712541341781616, 'learning_rate': 2.425e-05, 'epoch': 3.1}
+{'loss': 0.0159, 'grad_norm': 0.7634212970733643, 'learning_rate': 2.341666666666667e-05, 'epoch': 3.2}
+{'loss': 0.0206, 'grad_norm': 1.5768340826034546, 'learning_rate': 2.2583333333333335e-05, 'epoch': 3.3}
+{'loss': 0.0195, 'grad_norm': 0.3796348571777344, 'learning_rate': 2.175e-05, 'epoch': 3.4}
+{'loss': 0.0226, 'grad_norm': 0.49591338634490967, 'learning_rate': 2.091666666666667e-05, 'epoch': 3.5}
+{'loss': 0.0285, 'grad_norm': 0.23481231927871704, 'learning_rate': 2.0083333333333335e-05, 'epoch': 3.6}
+{'loss': 0.0156, 'grad_norm': 0.7325056791305542, 'learning_rate': 1.925e-05, 'epoch': 3.7}
+{'loss': 0.028, 'grad_norm': 0.716157078742981, 'learning_rate': 1.841666666666667e-05, 'epoch': 3.8}
+{'loss': 0.0103, 'grad_norm': 1.5975515842437744, 'learning_rate': 1.7583333333333335e-05, 'epoch': 3.9}
+{'loss': 0.0234, 'grad_norm': 0.20278723537921906, 'learning_rate': 1.675e-05, 'epoch': 4.0}
+{'loss': 0.0172, 'grad_norm': 0.3673444986343384, 'learning_rate': 1.591666666666667e-05, 'epoch': 4.1}
+{'loss': 0.016, 'grad_norm': 0.6794467568397522, 'learning_rate': 1.5083333333333335e-05, 'epoch': 4.2}
+{'loss': 0.0129, 'grad_norm': 1.4637274742126465, 'learning_rate': 1.4249999999999999e-05, 'epoch': 4.3}
+{'loss': 0.0214, 'grad_norm': 1.019705057144165, 'learning_rate': 1.3416666666666666e-05, 'epoch': 4.4}
+{'loss': 0.0144, 'grad_norm': 0.9328732490539551, 'learning_rate': 1.2583333333333334e-05, 'epoch': 4.5}
+{'loss': 0.0313, 'grad_norm': 2.414787530899048, 'learning_rate': 1.175e-05, 'epoch': 4.6}
+{'loss': 0.0321, 'grad_norm': 0.7159636616706848, 'learning_rate': 1.0916666666666667e-05, 'epoch': 4.7}
+{'loss': 0.0277, 'grad_norm': 0.6355525255203247, 'learning_rate': 1.0083333333333334e-05, 'epoch': 4.8}
+{'loss': 0.0206, 'grad_norm': 1.8428443670272827, 'learning_rate': 9.25e-06, 'epoch': 4.9}
+{'loss': 0.0201, 'grad_norm': 0.44408753514289856, 'learning_rate': 8.416666666666667e-06, 'epoch': 5.0}
+{'loss': 0.0204, 'grad_norm': 2.702193021774292, 'learning_rate': 7.583333333333334e-06, 'epoch': 5.1}
+{'loss': 0.0327, 'grad_norm': 2.130901336669922, 'learning_rate': 6.750000000000001e-06, 'epoch': 5.2}
+{'loss': 0.0236, 'grad_norm': 2.583890914916992, 'learning_rate': 5.916666666666667e-06, 'epoch': 5.3}
+{'loss': 0.0417, 'grad_norm': 2.275362253189087, 'learning_rate': 5.0833333333333335e-06, 'epoch': 5.4}
+{'loss': 0.047, 'grad_norm': 3.3780415058135986, 'learning_rate': 4.250000000000001e-06, 'epoch': 5.5}
+{'loss': 0.0624, 'grad_norm': 4.144228458404541, 'learning_rate': 3.4166666666666664e-06, 'epoch': 5.6}
+{'loss': 0.0702, 'grad_norm': 1.9479155540466309, 'learning_rate': 2.5833333333333333e-06, 'epoch': 5.7}
+{'loss': 0.078, 'grad_norm': 3.936119556427002, 'learning_rate': 1.7500000000000002e-06, 'epoch': 5.8}
+{'loss': 0.0955, 'grad_norm': 5.419748783111572, 'learning_rate': 9.166666666666667e-07, 'epoch': 5.9}
+{'loss': 0.1158, 'grad_norm': 4.048203945159912, 'learning_rate': 8.333333333333334e-08, 'epoch': 6.0}
+{'train_runtime': 203.9476, 'train_samples_per_second': 2.942, 'train_steps_per_second': 2.942, 'train_loss': 0.02671192432443301, 'epoch': 6.0}
+100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 600/600 [03:23<00:00,  2.94it/s]
+Saving model and tokenizer...
+Fine-tuning complete!

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "bos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<|endoftext|>",
+  "unk_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

test_output.txt ADDED Viewed

	@@ -0,0 +1,56 @@

+Loading gpt2_base model...
+Loading fine-tuned model...
+================================================================================
+Prompt 1: 'Har aansoon apni ek dastaan kehta hai.'
+================================================================================
+--- Fine-Tuned Model Output ---
+Aansoon khamoshi mein kahani sunate hain,
+Dil ke jazbaat sabko chhupate hain.
+Par kal phir muskaan bikhar jaayegi,
+Zindagi phir rang sajayegi.
+--- Base Model Output ---
+Aansoon khamoshi mein kahani sunate hain,
+Dil ke jazbaat sabko chhupate hain.
+Par kal phir muskaan bikhar jaayegi,
+Zindagi phir rang sajayegi.
+================================================================================
+Prompt 2: 'Jab bhi tum yaad aate ho.'
+================================================================================
+--- Fine-Tuned Model Output ---
+Phoolon ka rang uda jaata hai,
+Har khwaab ek nayi roshni laata hai.
+Jahan umeed ka diya jalaye rakho,
+Wahan zindagi naghme sunaye.
+--- Base Model Output ---
+Phoolon ka rang kabhi bekaar nahi jaata,
+Har koshish adhoori lagta hai.
+Magar waqt nayi tasveer banata,
+Dil phir se phool ki tarah khilta hai.
+================================================================================
+Prompt 3: 'Zindagi ki raahon mein, dhup aur chaon dono milte hai.'
+================================================================================
+--- Fine-Tuned Model Output ---
+Dhupo ka rang uda ho jaata hai,
+Har sapna toote pal ban jaata hai.
+Jo pal hansi mein kho jaaye,
+Woh zindagi ka rang geeton mein dikhati hai.
+--- Base Model Output ---
+Dhupo ka rang uda ho jaata,
+Har sapna sach ho to raah milti hai.
+Magar hausla rakho, raah nayi banegi,
+Phir se manzil roshan hogi.

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "add_bos_token": false,
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "50256": {
+      "content": "<|endoftext|>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<|endoftext|>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|endoftext|>",
+  "errors": "replace",
+  "extra_special_tokens": {},
+  "max_length": 168,
+  "model_max_length": 1024,
+  "pad_to_multiple_of": null,
+  "pad_token": "<|endoftext|>",
+  "pad_token_type_id": 0,
+  "padding_side": "right",
+  "stride": 0,
+  "tokenizer_class": "GPT2Tokenizer",
+  "truncation_side": "right",
+  "truncation_strategy": "longest_first",
+  "unk_token": "<|endoftext|>"
+}

vocab.json CHANGED Viewed

The diff for this file is too large to render. See raw diff