ifca-advanced-computing
/

Mistral-7B-Instruct-v0.3-EOSC

Question Answering

Model card Files Files and versions

judithspd commited on Jun 4

Commit

093aa7a

·

verified ·

1 Parent(s): e674e00

Update README.md

Files changed (1) hide show

README.md +51 -1

README.md CHANGED Viewed

@@ -5,4 +5,54 @@ language:
 base_model:
 - mistralai/Mistral-7B-Instruct-v0.3
 pipeline_tag: question-answering
----

 base_model:
 - mistralai/Mistral-7B-Instruct-v0.3
 pipeline_tag: question-answering
+---
+# Mistral-7B-Instruct-v0.3-EOSC
+Federated fine tuned version using data from the EOSC registry.
+Federated training configuration:
+- model.name = "mistralai/Mistral-7B-Instruct-v0.3"
+- model.quantization = 4
+- model.gradient-checkpointing = true
+- model.lora.peft-lora-r = 32
+- model.lora.peft-lora-alpha = 64
+- train.save-every-round = 5
+- train.learning-rate-max = 5e-5
+- train.learning-rate-min = 1e-6
+- train.seq-length = 512
+- train.training-arguments.per-device-train-batch-size = 16
+- train.training-arguments.gradient-accumulation-steps = 1
+- train.training-arguments.logging-steps = 10
+- train.training-arguments.num-train-epochs = 2
+- train.training-arguments.max-steps = 10
+- train.training-arguments.save-steps = 1000
+- train.training-arguments.save-total-limit = 10
+- train.training-arguments.gradient-checkpointing = true
+- train.training-arguments.lr-scheduler-type = "constant"
+- strategy.fraction-fit = 0.1
+- strategy.fraction-evaluate = 0.0
+- num-server-rounds = 10
+The PEFT presented in this model corresponds to 5 rounds of the FL training,
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: QuantizationMethod.BITS_AND_BYTES
+- _load_in_8bit: False
+- _load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: fp4
+- bnb_4bit_use_double_quant: False
+- bnb_4bit_compute_dtype: float32
+- bnb_4bit_quant_storage: uint8
+- load_in_4bit: True
+- load_in_8bit: False
+### Framework versions
+- PEFT 0.6.2