amd
/

Mixtral-8x7B-Instruct-v0.1_FP8_MLPerf_V3

Model card Files Files and versions

linzhao-amd commited on Jul 28

Commit

7b66cd6

·

verified ·

1 Parent(s): 5b1d7fe

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -12,7 +12,7 @@ base_model:
 - **Version**: MLPerf v5.1
 - **Commit**: Close Division Commit
 - **Supported Hardware Microarchitecture**: AMD MI300/MI325
-- **Transformers**: 4.51.0
 - **Quark:** [0.9](https://quark.docs.amd.com/latest/install.html)
 ## Calibration Dataset
@@ -38,7 +38,7 @@ The following layers are ignored during quantization:
 cd examples/torch/language_modeling/llm_ptq/
 MODEL_DIR="mistralai/Mixtral-8x7B-Instruct-v0.1"
 DATASET="./mlperf_data/mixtral_8x7b%2F2024.06.06_mixtral_15k_calibration_v4.pkl"
-OUTPUT_DIR="quantized_models/Mixtral-8x7B-Instruct-v0.1_FP8_MLPerf"
 python3 quantize_quark.py --model_dir "${MODEL}" \
                           --output_dir "${OUTPUT_DIR}" \

 - **Version**: MLPerf v5.1
 - **Commit**: Close Division Commit
 - **Supported Hardware Microarchitecture**: AMD MI300/MI325
+- **Transformers**: 4.46.3
 - **Quark:** [0.9](https://quark.docs.amd.com/latest/install.html)
 ## Calibration Dataset
 cd examples/torch/language_modeling/llm_ptq/
 MODEL_DIR="mistralai/Mixtral-8x7B-Instruct-v0.1"
 DATASET="./mlperf_data/mixtral_8x7b%2F2024.06.06_mixtral_15k_calibration_v4.pkl"
+OUTPUT_DIR="amd/Mixtral-8x7B-Instruct-v0.1_FP8_MLPerf_V3"
 python3 quantize_quark.py --model_dir "${MODEL}" \
                           --output_dir "${OUTPUT_DIR}" \