rookiemango commited on Sep 14, 2024

Commit

f2d0179

verified ·

1 Parent(s): 58beb49

Upload 115 files

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

llm-q-scaling-law-master/.gitignore +7 -0
llm-q-scaling-law-master/.gitmodules +3 -0
llm-q-scaling-law-master/README.md +23 -0
llm-q-scaling-law-master/configs/debug/integer.toml +19 -0
llm-q-scaling-law-master/configs/debug/mxint_4bit-bypass.toml +36 -0
llm-q-scaling-law-master/configs/debug/mxint_4bit-no_evaluate.toml +42 -0
llm-q-scaling-law-master/configs/debug/mxint_4bit-tinyllama.toml +42 -0
llm-q-scaling-law-master/configs/search/layerwise/custom-eval.toml +38 -0
llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml +42 -0
llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml +42 -0
llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-4.toml +42 -0
llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml +42 -0
llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml +42 -0
llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml +42 -0
llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml +42 -0
llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml +42 -0
llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-alpaca-random-50-bs-1.toml +42 -0
llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-alpaca-random-50-bs-2.toml +42 -0
llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-alpaca-random-50-bs-4.toml +42 -0
llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-alpaca-random-50-bs-8.toml +42 -0
llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml +42 -0
llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml +42 -0
llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-pajama-random-50-bs-4.toml +42 -0
llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml +42 -0
llm-q-scaling-law-master/eval_scripts/eval_harness_commands.txt +34 -0
llm-q-scaling-law-master/eval_scripts/layerwise/evalscript_generator.py +141 -0
llm-q-scaling-law-master/eval_scripts/layerwise/llama_layerwise_eval_commands.txt +36 -0
llm-q-scaling-law-master/eval_scripts/layerwise/opt_layerwise_eval_commands.txt +72 -0
llm-q-scaling-law-master/eval_scripts/layerwise/qwen1.5_layerwise_eval_commands.txt +72 -0
llm-q-scaling-law-master/eval_scripts/matmult/evalscript_generator.py +142 -0
llm-q-scaling-law-master/eval_scripts/matmult/llama_matmult_eval_commands.txt +28 -0
llm-q-scaling-law-master/eval_scripts/matmult/opt_matmult_eval_commands.txt +56 -0
llm-q-scaling-law-master/eval_scripts/matmult/qwen1.5_matmult_eval_commands.txt +56 -0
llm-q-scaling-law-master/q_ratio_results/layerwise/qwen1.5/qwen-0.5B-best-trail.txt +0 -0
llm-q-scaling-law-master/q_ratio_results/layerwise/qwen1.5/qwen-1.8B-best-trail.txt +0 -0
llm-q-scaling-law-master/q_ratio_results/layerwise/qwen1.5/qwen-14B-best-trail.txt +7 -0
llm-q-scaling-law-master/q_ratio_results/layerwise/qwen1.5/qwen-32B-best-trail.txt +8 -0
llm-q-scaling-law-master/q_ratio_results/layerwise/qwen1.5/qwen-4B-best-trail.txt +0 -0
llm-q-scaling-law-master/q_ratio_results/layerwise/qwen1.5/qwen-72B-best-trail.txt +8 -0
llm-q-scaling-law-master/q_ratio_results/layerwise/qwen1.5/qwen-7B-best-trail.txt +0 -0
llm-q-scaling-law-master/q_ratio_results/matmult/qwen1.5/qwen-32B-best-trail.txt +6 -0
llm-q-scaling-law-master/requirements.txt +26 -0
llm-q-scaling-law-master/run_scripts/env_command.sh +23 -0
llm-q-scaling-law-master/run_scripts/layerwise/llama2_layerwise_run_commands.txt +24 -0
llm-q-scaling-law-master/run_scripts/layerwise/llama_layerwise_run_commands.txt +32 -0
llm-q-scaling-law-master/run_scripts/layerwise/opt_layerwise_run_commands.txt +64 -0
llm-q-scaling-law-master/run_scripts/layerwise/qwen1.5_layerwise_run_commands.txt +64 -0
llm-q-scaling-law-master/run_scripts/layerwise/runscript_generator.py +111 -0
llm-q-scaling-law-master/run_scripts/matmult/llama2_matmult_run_commands.txt +18 -0
llm-q-scaling-law-master/run_scripts/matmult/llama_matmult_run_commands.txt +24 -0

llm-q-scaling-law-master/.gitignore ADDED Viewed

	@@ -0,0 +1,7 @@

+.vscode/
+__pycache__/
+checkpoints/
+wandb/
+ckpts/
+ckpt/
+results/

llm-q-scaling-law-master/.gitmodules ADDED Viewed

	@@ -0,0 +1,3 @@

+[submodule "src/lm-evaluation-harness"]
+	path = src/lm-evaluation-harness
+	url = [email protected]:EleutherAI/lm-evaluation-harness.git

llm-q-scaling-law-master/README.md ADDED Viewed

	@@ -0,0 +1,23 @@

+# LLM Quantisation Scaling Law
+## Setup
+Conda environment is recommended. To create a conda environment, run:
+```bash
+conda create -n llm-mixed-q python=3.11 -y
+pip install -r requirements.txt
+git submodule update --init --recursive
+```
+## Features
+* Supported model architectures:
+  + Qwen2
+  + OPT
+  + Llama
+## Entry points
+The configuration file for model and search parameters is located in `./config/`.

llm-q-scaling-law-master/configs/debug/integer.toml ADDED Viewed

	@@ -0,0 +1,19 @@

+[quantization]
+name = "integer"
+data_in_width = 16
+data_in_frac_width = 3
+weight_width = 16
+weight_frac_width = 3
+bias_width = 16
+bias_frac_width = 3
+[setup]
+# low to high precision ratio
+ratio = 0.1
+# at what granularity?
+# select from ["transformer_layer", "matmult"]
+granularity = "transformer_layer"
+tasks = ['sst', 'mnli']
+batch_size = 16
+num_samples_per_trial = 1024
+num_trials = 16

llm-q-scaling-law-master/configs/debug/mxint_4bit-bypass.toml ADDED Viewed

	@@ -0,0 +1,36 @@

+[quantization.linear.x]
+    name="bypass"
+    width=8
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="bypass"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="bypass"
+    width=8
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="bypass"
+    width=8
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.9
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="transformer_layer"
+    # granularity="matmult"
+    tasks=['custom_alpaca']
+    batch_size=8
+    num_samples_per_trial=10
+    num_trials=3
+    device_map="auto-balanced"
+    random=true

llm-q-scaling-law-master/configs/debug/mxint_4bit-no_evaluate.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.9
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="transformer_layer"
+    # granularity="matmult"
+    tasks=['custom_alpaca']
+    batch_size=4
+    num_samples_per_trial=1000
+    num_trials=3
+    device_map="auto-balanced"
+    random=true
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=[]
+    batch_size=1
+    num_best_epochs=1

llm-q-scaling-law-master/configs/debug/mxint_4bit-tinyllama.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.9
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="transformer_layer"
+    # granularity="matmult"
+    tasks=['custom_alpaca']
+    batch_size=8
+    num_samples_per_trial=100
+    num_trials=3
+    device_map="auto-balanced"
+    random=true
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=8
+    num_best_epochs=1

llm-q-scaling-law-master/configs/search/layerwise/custom-eval.toml ADDED Viewed

	@@ -0,0 +1,38 @@

+[quantization.linear.x] # this is E2M1
+    name="minifloat"
+    width=4
+    exponent_width=2
+[quantization.linear.w]
+    name="minifloat"
+    width=4
+    exponent_width=2
+[quantization.matmul.x]
+    name="minifloat"
+    width=4
+    exponent_width=2
+[quantization.matmul.w]
+    name="minifloat"
+    width=4
+    exponent_width=2
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="transformer_layer"
+    # granularity="matmult"
+    tasks=['custom_pajama']
+    batch_size=8
+    num_samples_per_trial=1000
+    num_trials=4
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['scaling_law_easy', 'scaling_law_hard']
+    batch_size="auto:8"
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="transformer_layer"
+    # granularity="matmult"
+    tasks=['custom_alpaca']
+    batch_size=1
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=1
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="transformer_layer"
+    # granularity="matmult"
+    tasks=['custom_alpaca']
+    batch_size=2
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=2
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-4.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="transformer_layer"
+    # granularity="matmult"
+    tasks=['custom_alpaca']
+    batch_size=4
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=4
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="transformer_layer"
+    # granularity="matmult"
+    tasks=['custom_alpaca']
+    batch_size=8
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=8
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="transformer_layer"
+    # granularity="matmult"
+    tasks=['custom_pajama']
+    batch_size=1
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=1
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="transformer_layer"
+    # granularity="matmult"
+    tasks=['custom_pajama']
+    batch_size=2
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=2
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="transformer_layer"
+    # granularity="matmult"
+    tasks=['custom_pajama']
+    batch_size=4
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=4
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="transformer_layer"
+    # granularity="matmult"
+    tasks=['custom_pajama']
+    batch_size=8
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=8
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-alpaca-random-50-bs-1.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="matmult"
+    # granularity="matmult"
+    tasks=['custom_alpaca']
+    batch_size=1
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=1
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-alpaca-random-50-bs-2.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="matmult"
+    # granularity="matmult"
+    tasks=['custom_alpaca']
+    batch_size=2
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=1
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-alpaca-random-50-bs-4.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="matmult"
+    # granularity="matmult"
+    tasks=['custom_alpaca']
+    batch_size=4
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=1
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-alpaca-random-50-bs-8.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="matmult"
+    # granularity="matmult"
+    tasks=['custom_alpaca']
+    batch_size=8
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=1
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="matmult"
+    # granularity="matmult"
+    tasks=['custom_pajama']
+    batch_size=1
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=1
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="matmult"
+    # granularity="matmult"
+    tasks=['custom_pajama']
+    batch_size=2
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=2
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-pajama-random-50-bs-4.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="matmult"
+    # granularity="matmult"
+    tasks=['custom_pajama']
+    batch_size=4
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=4
+    num_best_epochs=3

llm-q-scaling-law-master/configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml ADDED Viewed

	@@ -0,0 +1,42 @@

+[quantization.linear.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.linear.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.x]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-2
+[quantization.matmul.w]
+    name="mxint"
+    width=4
+    block_size=16
+    block_axis=-1
+[setup]
+    # low to high precision ratio
+    ratio=0.0
+    # at what granularity?
+    # select from ["transformer_layer", "matmult"]
+    granularity="matmult"
+    # granularity="matmult"
+    tasks=['custom_pajama']
+    batch_size=8
+    num_samples_per_trial=1000
+    num_trials=50
+    device_map="auto-balanced"
+    random=false
+[evaluation]
+    # set to [] if not using any evaluation benchmarks
+    tasks=['mmlu']
+    batch_size=8
+    num_best_epochs=3

llm-q-scaling-law-master/eval_scripts/eval_harness_commands.txt ADDED Viewed

	@@ -0,0 +1,34 @@

+accelerate launch -m lm_eval --model hf \
+    --tasks mmlu \
+    --model_args pretrained=Qwen/Qwen1.5-0.5B \
+    --batch_size 8
+accelerate launch -m lm_eval --model hf \
+    --tasks mmlu \
+    --model_args pretrained=Qwen/Qwen1.5-1.8B \
+    --batch_size 8
+accelerate launch -m lm_eval --model hf \
+    --tasks mmlu \
+    --model_args pretrained=Qwen/Qwen1.5-4B \
+    --batch_size 8
+accelerate launch -m lm_eval --model hf \
+    --tasks mmlu \
+    --model_args pretrained=Qwen/Qwen1.5-7B \
+    --batch_size 4
+lm_eval --model hf \
+    --tasks mmlu \
+    --model_args pretrained=Qwen/Qwen1.5-14B,parallelize=True \
+    --batch_size 8
+lm_eval --model hf \
+    --tasks mmlu \
+    --model_args pretrained=Qwen/Qwen1.5-32B,parallelize=True \
+    --batch_size 4
+lm_eval --model hf \
+    --tasks mmlu \
+    --model_args pretrained=Qwen/Qwen1.5-72B,parallelize=True \
+    --batch_size 1

llm-q-scaling-law-master/eval_scripts/layerwise/evalscript_generator.py ADDED Viewed

	@@ -0,0 +1,141 @@

+"""
+This generates the runscripts for the LLM-Q scaling law simulations.
+"""
+import os
+import argparse
+# the search command is
+#python src/main.py --model_name {model_name} --search_config configs/search/mxint_4bit-tinyllama.toml --model_parallel --disable_wandb --save_dir ../ckpt/test
+# the save dir is
+# results/search/layerwise/{model_name}_{ratio}
+granularity = ["transformer_layer"]
+# opt template for searching
+opt_model_sizes=["opt-125m","opt-350m","opt-1.3b","opt-2.7b","opt-6.7b","opt-13b","opt-30b","opt-66b"]
+opt_batch_size = [8,8,8,8,4,2,1,1]
+opt_layer_wise_ratios = [0.0,0.5,0.6,0.7,0.8,0.9,0.95,0.975]
+opt_layer_wise_search_config_template = "mxint_4bit-pajama-random-50-bs-{}.toml"
+opt_layer_wise_search_dir_template = "eval/layerwise/{}_{}"
+opt_layerwise_run_command_palette = "python src/full_eval.py --model_arch opt --model_name {model_name} --ratio {q_ratio} --eval_config configs/search/layerwise/{search_config} --model_parallel --quantized_list \"{quantized_list}\""
+with open("opt_layerwise_eval_commands.txt", "w") as f:
+    for i in range(len(opt_model_sizes)):
+        eval_best_trail_file = "../../q_ratio_results/layerwise/opt/opt-{}-best-trail.txt".format(opt_model_sizes[i].split("-")[1])
+        try:
+            with open(eval_best_trail_file, "r") as fi:
+                # read each line
+                lines = fi.readlines()
+                best_trail_q_lists_mapping = {}
+                for line in lines:
+                    q_ratio, q_list = line.split(":")
+                    q_list = q_list.strip()
+                    #remove [] from the string
+                    q_list = q_list[1:-1]
+                    q_ratio = q_ratio.strip()
+                    best_trail_q_lists_mapping[q_ratio] = q_list
+        except FileNotFoundError:
+            best_trail_q_lists_mapping = {}
+        model_size = opt_model_sizes[i]
+        model_batch_size = opt_batch_size[i]
+        for ratio in opt_layer_wise_ratios:
+            search_config = opt_layer_wise_search_config_template.format(model_batch_size)
+            save_dir = opt_layer_wise_search_dir_template.format(model_size, ratio)
+            q_list = best_trail_q_lists_mapping[str(ratio)] if str(ratio) in best_trail_q_lists_mapping else ""
+            model_name = f"facebook/{model_size}"
+            run_command = opt_layerwise_run_command_palette.format(model_name=model_name, q_ratio=ratio, search_config=search_config, save_dir=save_dir, quantized_list=q_list)
+            # print(run_command)
+            f.write(run_command + "\n")
+        f.write("\n")
+# qwen template for searching
+qwen15_model_sizes=["Qwen1.5-0.5B","Qwen1.5-1.8B","Qwen1.5-4B","Qwen1.5-7B","Qwen1.5-14B","Qwen1.5-32B","Qwen1.5-72B","Qwen1.5-110B"]
+qwen15_batch_size = [8,8,4,2,2,2,1,1]
+qwen15_layer_wise_ratios = [0.0,0.5,0.6,0.7,0.8,0.9,0.95,0.975]
+qwen15_layer_wise_search_config_template = "mxint_4bit-pajama-random-50-bs-{}.toml"
+qwen15_layer_wise_search_dir_template = "eval/layerwise/{}_{}"
+qwen15_layerwise_run_command_palette = "python src/full_eval.py --model_arch qwen2 --model_name {model_name} --ratio {q_ratio} --eval_config configs/search/layerwise/{search_config} --model_parallel --quantized_list \"{quantized_list}\""
+with open("qwen1.5_layerwise_eval_commands.txt", "w") as f:
+    for i in range(len(qwen15_model_sizes)):
+        eval_best_trail_file = "../../q_ratio_results/layerwise/qwen1.5/qwen-{}-best-trail.txt".format(qwen15_model_sizes[i].split("-")[1])
+        try:
+            with open(eval_best_trail_file, "r") as fi:
+                # read each line
+                lines = fi.readlines()
+                best_trail_q_lists_mapping = {}
+                for line in lines:
+                    q_ratio, q_list = line.split(":")
+                    q_list = q_list.strip()
+                    q_list = q_list[1:-1]
+                    q_ratio = q_ratio.strip()
+                    best_trail_q_lists_mapping[q_ratio] = q_list
+        except FileNotFoundError:
+            best_trail_q_lists_mapping = {}
+        # print(best_trail_q_lists_mapping)
+        model_size = qwen15_model_sizes[i]
+        model_batch_size = qwen15_batch_size[i]
+        for ratio in qwen15_layer_wise_ratios:
+            search_config = qwen15_layer_wise_search_config_template.format(model_batch_size)
+            save_dir = qwen15_layer_wise_search_dir_template.format(model_size, ratio)
+            model_name = f"Qwen/{model_size}"
+            q_list = best_trail_q_lists_mapping[str(ratio)] if str(ratio) in best_trail_q_lists_mapping else ""
+            run_command = qwen15_layerwise_run_command_palette.format(model_name=model_name, q_ratio=ratio, search_config=search_config, save_dir=save_dir, quantized_list=q_list)
+            # print(run_command)
+            f.write(run_command + "\n")
+        f.write("\n")
+# llama template for searching
+# qwen template for searching
+llama_model_sizes=["llama-7b","llama-13b","llama-30b","llama-65b"]
+llama_batch_size = [2,2,1,1]
+llama_layer_wise_ratios = [0.0,0.5,0.6,0.7,0.8,0.9,0.95,0.975]
+llama_layer_wise_search_config_template = "mxint_4bit-pajama-random-50-bs-{}.toml"
+llama_layer_wise_search_dir_template = "eval/layerwise/{}_{}"
+llama_layerwise_run_command_palette = "python src/full_eval.py --model_arch llama --model_name {model_name} --ratio {q_ratio} --eval_config configs/search/layerwise/{search_config} --model_parallel --quantized_list \"{quantized_list}\""
+with open("llama_layerwise_eval_commands.txt", "w") as f:
+    for i in range(len(llama_model_sizes)):
+        eval_best_trail_file = "../../q_ratio_results/layerwise/llama/llama-{}-best-trail.txt".format(qwen15_model_sizes[i].split("-")[1])
+        try:
+            with open(eval_best_trail_file, "r") as fi:
+                # read each line
+                lines = fi.readlines()
+                best_trail_q_lists_mapping = {}
+                for line in lines:
+                    q_ratio, q_list = line.split(":")
+                    q_list = q_list.strip()
+                    q_list = q_list[1:-1]
+                    q_ratio = q_ratio.strip()
+                    best_trail_q_lists_mapping[q_ratio] = q_list
+        except FileNotFoundError:
+            best_trail_q_lists_mapping = {}
+        model_size = llama_model_sizes[i]
+        model_batch_size = llama_batch_size[i]
+        for ratio in llama_layer_wise_ratios:
+            search_config = llama_layer_wise_search_config_template.format(model_batch_size)
+            save_dir = llama_layer_wise_search_dir_template.format(model_size, ratio)
+            model_name = f"huggyllama/{model_size}"
+            q_list = best_trail_q_lists_mapping[str(ratio)] if str(ratio) in best_trail_q_lists_mapping else ""
+            run_command = llama_layerwise_run_command_palette.format(model_name=model_name, q_ratio=ratio, search_config=search_config, save_dir=save_dir, quantized_list=q_list)
+            # print(run_command)
+            f.write(run_command + "\n")
+        f.write("\n")

llm-q-scaling-law-master/eval_scripts/layerwise/llama_layerwise_eval_commands.txt ADDED Viewed

	@@ -0,0 +1,36 @@

+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-7b --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-7b --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-7b --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-7b --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-7b --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-7b --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-7b --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-7b --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-13b --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-13b --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-13b --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-13b --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-13b --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-13b --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-13b --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-13b --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-30b --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-30b --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-30b --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-30b --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-30b --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-30b --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-30b --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-30b --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-65b --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-65b --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-65b --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-65b --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-65b --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-65b --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-65b --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-65b --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""

llm-q-scaling-law-master/eval_scripts/layerwise/opt_layerwise_eval_commands.txt ADDED Viewed

	@@ -0,0 +1,72 @@

+python src/full_eval.py --model_arch opt --model_name facebook/opt-125m --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-125m --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-125m --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-125m --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-125m --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-125m --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-125m --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-125m --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-350m --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-350m --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-350m --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-350m --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-350m --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-350m --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-350m --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-350m --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-1.3b --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-1.3b --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-1.3b --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-1.3b --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-1.3b --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-1.3b --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-1.3b --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-1.3b --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-2.7b --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-2.7b --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-2.7b --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-2.7b --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-2.7b --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-2.7b --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-2.7b --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-2.7b --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-6.7b --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-6.7b --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-6.7b --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-6.7b --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-6.7b --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-6.7b --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-6.7b --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-6.7b --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-13b --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-13b --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-13b --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-13b --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-13b --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-13b --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-13b --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-13b --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-30b --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-30b --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-30b --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-30b --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-30b --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-30b --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-30b --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-30b --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-66b --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-66b --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-66b --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-66b --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-66b --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-66b --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-66b --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-66b --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""

llm-q-scaling-law-master/eval_scripts/layerwise/qwen1.5_layerwise_eval_commands.txt ADDED Viewed

	@@ -0,0 +1,72 @@

+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-0.5B --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-0.5B --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-0.5B --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-0.5B --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-0.5B --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-0.5B --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-0.5B --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-0.5B --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-1.8B --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-1.8B --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-1.8B --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-1.8B --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-1.8B --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-1.8B --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-1.8B --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-1.8B --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-4B --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-4B --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-4B --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-4B --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-4B --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-4B --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-4B --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-4B --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-7B --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-7B --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-7B --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-7B --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-7B --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-7B --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-7B --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-7B --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-14B --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-14B --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list "1, 1, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-14B --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list "1, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 0"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-14B --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list "1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1, 0, 0"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-14B --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list "1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 1, 1, 0, 1, 0, 1, 1"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-14B --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list "1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-14B --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list "1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-14B --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list "1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-32B --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list "0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-32B --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list "1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-32B --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list "0, 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 1, 0, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 1, 1, 1, 0, 0, 1, 0, 0, 1, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 0, 1, 0, 0, 0, 1, 0"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-32B --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list "1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 0, 1, 0"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-32B --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list "1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 0, 0, 1, 0, 1, 0, 1, 0"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-32B --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list "0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 1"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-32B --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list "0, 1, 1, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-32B --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-72B --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list "0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-72B --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list "0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 1, 1, 0, 1, 1, 1, 0, 0"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-72B --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list "1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 0, 0, 0, 0, 1, 0, 1"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-72B --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list "0, 0, 0, 1, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 0, 1, 0, 0, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-72B --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list "1, 0, 1, 0, 0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-72B --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list "0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-72B --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list "0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-72B --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-110B --ratio 0.0 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-110B --ratio 0.5 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-110B --ratio 0.6 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-110B --ratio 0.7 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-110B --ratio 0.8 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-110B --ratio 0.9 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-110B --ratio 0.95 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-110B --ratio 0.975 --eval_config configs/search/layerwise/mxint_4bit-alpaca-random-50-bs-1.toml --model_parallel --quantized_list ""

llm-q-scaling-law-master/eval_scripts/matmult/evalscript_generator.py ADDED Viewed

	@@ -0,0 +1,142 @@

+"""
+This generates the runscripts for the LLM-Q scaling law simulations.
+"""
+import os
+import argparse
+# the search command is
+#python src/main.py --model_name {model_name} --search_config configs/search/mxint_4bit-tinyllama.toml --model_parallel --disable_wandb --save_dir ../ckpt/test
+# the save dir is
+# results/search/layerwise/{model_name}_{ratio}
+granularity = ["matmult"]
+# opt template for searching
+opt_model_sizes=["opt-125m","opt-350m","opt-1.3b","opt-2.7b","opt-6.7b","opt-13b","opt-30b","opt-66b"]
+opt_batch_size = [8,8,8,8,4,2,1,1]
+opt_matmult_ratios = [0.0,0.5,0.9,0.95,0.975,0.99]
+opt_matmult_search_config_template = "mxint_4bit-pajama-random-50-bs-{}.toml"
+opt_matmult_search_dir_template = "eval/matmult/{}_{}"
+opt_matmult_run_command_palette = "python src/full_eval.py --model_arch opt --model_name {model_name} --ratio {q_ratio} --eval_config configs/search/matmult/{search_config} --model_parallel --quantized_list \"{quantized_list}\""
+with open("opt_matmult_eval_commands.txt", "w") as f:
+    for i in range(len(opt_model_sizes)):
+        eval_best_trail_file = "../../q_ratio_results/matmult/opt/opt-{}-best-trail.txt".format(opt_model_sizes[i].split("-")[1])
+        try:
+            with open(eval_best_trail_file, "r") as fi:
+                # read each line
+                lines = fi.readlines()
+                best_trail_q_lists_mapping = {}
+                for line in lines:
+                    q_ratio, q_list = line.split(":")
+                    q_list = q_list.strip()
+                    #remove [] from the string
+                    q_list = q_list[1:-1]
+                    q_ratio = q_ratio.strip()
+                    best_trail_q_lists_mapping[q_ratio] = q_list
+        except FileNotFoundError:
+            best_trail_q_lists_mapping = {}
+        model_size = opt_model_sizes[i]
+        model_batch_size = opt_batch_size[i]
+        for ratio in opt_matmult_ratios:
+            search_config = opt_matmult_search_config_template.format(model_batch_size)
+            save_dir = opt_matmult_search_dir_template.format(model_size, ratio)
+            q_list = best_trail_q_lists_mapping[str(ratio)] if str(ratio) in best_trail_q_lists_mapping else ""
+            model_name = f"facebook/{model_size}"
+            run_command = opt_matmult_run_command_palette.format(model_name=model_name, q_ratio=ratio, search_config=search_config, save_dir=save_dir, quantized_list=q_list)
+            # print(run_command)
+            f.write(run_command + "\n")
+        f.write("\n")
+# qwen template for searching
+qwen15_model_sizes=["Qwen1.5-0.5B","Qwen1.5-1.8B","Qwen1.5-4B","Qwen1.5-7B","Qwen1.5-14B","Qwen1.5-32B","Qwen1.5-72B","Qwen1.5-110B"]
+qwen15_batch_size = [8,8,4,2,2,2,1,1]
+qwen15_matmult_ratios = [0.0,0.5,0.9,0.95,0.975,0.99]
+qwen15_matmult_search_config_template = "mxint_4bit-pajama-random-50-bs-{}.toml"
+qwen15_matmult_search_dir_template = "eval/matmult/{}_{}"
+qwen15_matmult_run_command_palette = "python src/full_eval.py --model_arch qwen2 --model_name {model_name} --ratio {q_ratio} --eval_config configs/search/matmult/{search_config} --model_parallel --quantized_list \"{quantized_list}\""
+with open("qwen1.5_matmult_eval_commands.txt", "w") as f:
+    for i in range(len(qwen15_model_sizes)):
+        eval_best_trail_file = "../../q_ratio_results/matmult/qwen1.5/qwen-{}-best-trail.txt".format(qwen15_model_sizes[i].split("-")[1])
+        try:
+            with open(eval_best_trail_file, "r") as fi:
+                # print("Reading best trail file: ", eval_best_trail_file)
+                # read each line
+                lines = fi.readlines()
+                best_trail_q_lists_mapping = {}
+                for line in lines:
+                    q_ratio, q_list = line.split(":")
+                    q_list = q_list.strip()
+                    q_list = q_list[1:-1]
+                    q_ratio = q_ratio.strip()
+                    best_trail_q_lists_mapping[q_ratio] = q_list
+        except FileNotFoundError:
+            best_trail_q_lists_mapping = {}
+        # print(best_trail_q_lists_mapping)
+        model_size = qwen15_model_sizes[i]
+        model_batch_size = qwen15_batch_size[i]
+        for ratio in qwen15_matmult_ratios:
+            search_config = qwen15_matmult_search_config_template.format(model_batch_size)
+            save_dir = qwen15_matmult_search_dir_template.format(model_size, ratio)
+            model_name = f"Qwen/{model_size}"
+            q_list = best_trail_q_lists_mapping[str(ratio)] if str(ratio) in best_trail_q_lists_mapping else ""
+            run_command = qwen15_matmult_run_command_palette.format(model_name=model_name, q_ratio=ratio, search_config=search_config, save_dir=save_dir, quantized_list=q_list)
+            # print(run_command)
+            f.write(run_command + "\n")
+        f.write("\n")
+# llama template for searching
+# qwen template for searching
+llama_model_sizes=["llama-7b","llama-13b","llama-30b","llama-65b"]
+llama_batch_size = [2,2,1,1]
+llama_matmult_ratios = [0.0,0.5,0.9,0.95,0.975,0.99]
+llama_matmult_search_config_template = "mxint_4bit-pajama-random-50-bs-{}.toml"
+llama_matmult_search_dir_template = "eval/matmult/{}_{}"
+llama_matmult_run_command_palette = "python src/full_eval.py --model_arch llama --model_name {model_name} --ratio {q_ratio} --eval_config configs/search/matmult/{search_config} --model_parallel --quantized_list \"{quantized_list}\""
+with open("llama_matmult_eval_commands.txt", "w") as f:
+    for i in range(len(llama_model_sizes)):
+        eval_best_trail_file = "../../q_ratio_results/matmult/llama/llama-{}-best-trail.txt".format(qwen15_model_sizes[i].split("-")[1])
+        try:
+            with open(eval_best_trail_file, "r") as fi:
+                # read each line
+                lines = fi.readlines()
+                best_trail_q_lists_mapping = {}
+                for line in lines:
+                    q_ratio, q_list = line.split(":")
+                    q_list = q_list.strip()
+                    q_list = q_list[1:-1]
+                    q_ratio = q_ratio.strip()
+                    best_trail_q_lists_mapping[q_ratio] = q_list
+        except FileNotFoundError:
+            best_trail_q_lists_mapping = {}
+        model_size = llama_model_sizes[i]
+        model_batch_size = llama_batch_size[i]
+        for ratio in llama_matmult_ratios:
+            search_config = llama_matmult_search_config_template.format(model_batch_size)
+            save_dir = llama_matmult_search_dir_template.format(model_size, ratio)
+            model_name = f"huggyllama/{model_size}"
+            q_list = best_trail_q_lists_mapping[str(ratio)] if str(ratio) in best_trail_q_lists_mapping else ""
+            run_command = llama_matmult_run_command_palette.format(model_name=model_name, q_ratio=ratio, search_config=search_config, save_dir=save_dir, quantized_list=q_list)
+            # print(run_command)
+            f.write(run_command + "\n")
+        f.write("\n")

llm-q-scaling-law-master/eval_scripts/matmult/llama_matmult_eval_commands.txt ADDED Viewed

	@@ -0,0 +1,28 @@

+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-7b --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-7b --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-7b --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-7b --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-7b --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-7b --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-13b --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-13b --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-13b --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-13b --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-13b --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-13b --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-30b --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-30b --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-30b --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-30b --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-30b --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-30b --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-65b --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-65b --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-65b --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-65b --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-65b --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch llama --model_name huggyllama/llama-65b --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""

llm-q-scaling-law-master/eval_scripts/matmult/opt_matmult_eval_commands.txt ADDED Viewed

	@@ -0,0 +1,56 @@

+python src/full_eval.py --model_arch opt --model_name facebook/opt-125m --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-125m --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-125m --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-125m --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-125m --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-125m --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-350m --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-350m --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-350m --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-350m --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-350m --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-350m --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-1.3b --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-1.3b --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-1.3b --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-1.3b --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-1.3b --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-1.3b --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-2.7b --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-2.7b --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-2.7b --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-2.7b --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-2.7b --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-2.7b --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-6.7b --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-6.7b --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-6.7b --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-6.7b --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-6.7b --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-6.7b --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-13b --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-13b --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-13b --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-13b --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-13b --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-13b --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-30b --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-30b --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-30b --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-30b --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-30b --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-30b --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-66b --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-66b --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-66b --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-66b --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-66b --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch opt --model_name facebook/opt-66b --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""

llm-q-scaling-law-master/eval_scripts/matmult/qwen1.5_matmult_eval_commands.txt ADDED Viewed

	@@ -0,0 +1,56 @@

+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-0.5B --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-0.5B --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-0.5B --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-0.5B --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-0.5B --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-0.5B --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-1.8B --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-1.8B --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-1.8B --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-1.8B --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-1.8B --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-1.8B --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-4B --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-4B --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-4B --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-4B --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-4B --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-4B --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-7B --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-7B --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-7B --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-7B --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-7B --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-7B --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-14B --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-14B --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-14B --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-14B --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-14B --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-14B --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-32B --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list "0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-32B --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list "1, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0, 1, 0, 1, 1, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 1, 1, 0, 0, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 1, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 0, 1, 1, 0, 0, 0, 1, 0, 1, 0, 0, 1, 1, 0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 0, 1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 1, 1, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 0"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-32B --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list "1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-32B --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list "1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 1, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-32B --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list "1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-32B --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --quantized_list "1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1"
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-72B --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-72B --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-72B --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-72B --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-72B --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-72B --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-110B --ratio 0.0 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-110B --ratio 0.5 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-110B --ratio 0.9 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-110B --ratio 0.95 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-110B --ratio 0.975 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""
+python src/full_eval.py --model_arch qwen2 --model_name Qwen/Qwen1.5-110B --ratio 0.99 --eval_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --quantized_list ""

llm-q-scaling-law-master/q_ratio_results/layerwise/qwen1.5/qwen-0.5B-best-trail.txt ADDED Viewed

File without changes

llm-q-scaling-law-master/q_ratio_results/layerwise/qwen1.5/qwen-1.8B-best-trail.txt ADDED Viewed

File without changes

llm-q-scaling-law-master/q_ratio_results/layerwise/qwen1.5/qwen-14B-best-trail.txt ADDED Viewed

	@@ -0,0 +1,7 @@

+0.5 : [1, 1, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0]
+0.6 : [1, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 0]
+0.7 : [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1, 0, 0]
+0.8 : [1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 1, 1, 0, 1, 0, 1, 1]
+0.9 : [1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1]
+0.95 : [1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1]
+0.975 : [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1]

llm-q-scaling-law-master/q_ratio_results/layerwise/qwen1.5/qwen-32B-best-trail.txt ADDED Viewed

	@@ -0,0 +1,8 @@

+0.0 : [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
+0.5 : [1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0]
+0.6 : [0, 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 1, 0, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 1, 1, 1, 0, 0, 1, 0, 0, 1, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 0, 1, 0, 0, 0, 1, 0]
+0.7 : [1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 0, 1, 0]
+0.8 : [1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 0, 0, 1, 0, 1, 0, 1, 0]
+0.9 : [0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 1]
+0.95 : [0, 1, 1, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0]
+0.975 :

llm-q-scaling-law-master/q_ratio_results/layerwise/qwen1.5/qwen-4B-best-trail.txt ADDED Viewed

File without changes

llm-q-scaling-law-master/q_ratio_results/layerwise/qwen1.5/qwen-72B-best-trail.txt ADDED Viewed

	@@ -0,0 +1,8 @@

+0.0 : [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
+0.5 : [0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 1, 1, 0, 1, 1, 1, 0, 0]
+0.6 : [1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 0, 0, 0, 0, 1, 0, 1]
+0.7 : [0, 0, 0, 1, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 0, 1, 0, 0, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0]
+0.8 : [1, 0, 1, 0, 0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1]
+0.9 : [0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1]
+0.95 : [0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
+0.975 :

llm-q-scaling-law-master/q_ratio_results/layerwise/qwen1.5/qwen-7B-best-trail.txt ADDED Viewed

File without changes

llm-q-scaling-law-master/q_ratio_results/matmult/qwen1.5/qwen-32B-best-trail.txt ADDED Viewed

	@@ -0,0 +1,6 @@

+0.0 : [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
+0.5 : [1, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0, 1, 0, 1, 1, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 1, 1, 0, 0, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 1, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 0, 1, 1, 0, 0, 0, 1, 0, 1, 0, 0, 1, 1, 0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 0, 1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 1, 1, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 0]
+0.9 : [1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0]
+0.95 : [1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 1, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1]
+0.975 : [1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
+0.99 : [1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]

llm-q-scaling-law-master/requirements.txt ADDED Viewed

	@@ -0,0 +1,26 @@

+torch==2.3.1
+transformers==4.42.3
+datasets==2.20.0
+nvitop
+accelerate
+joblib
+optuna
+wandb
+toml
+evaluate>=0.4.0
+jsonlines
+numexpr
+peft>=0.2.0
+pybind11>=2.6.2
+pytablewriter
+rouge-score>=0.0.4
+sacrebleu>=1.5.0
+scikit-learn>=0.24.1
+sqlitedict
+tqdm-multiprocess
+zstandard
+dill
+word2number
+more_itertools
+sentencepiece

llm-q-scaling-law-master/run_scripts/env_command.sh ADDED Viewed

	@@ -0,0 +1,23 @@

+export CUDA_VISIBLE_DEVICES=0
+conda activate llm-mixed-q
+export CUDA_VISIBLE_DEVICES=1
+conda activate llm-mixed-q
+export CUDA_VISIBLE_DEVICES=2
+conda activate llm-mixed-q
+export CUDA_VISIBLE_DEVICES=3
+conda activate llm-mixed-q
+export CUDA_VISIBLE_DEVICES=4
+conda activate llm-mixed-q
+export CUDA_VISIBLE_DEVICES=5
+conda activate llm-mixed-q
+export CUDA_VISIBLE_DEVICES=6
+conda activate llm-mixed-q
+export CUDA_VISIBLE_DEVICES=7
+conda activate llm-mixed-q

llm-q-scaling-law-master/run_scripts/layerwise/llama2_layerwise_run_commands.txt ADDED Viewed

	@@ -0,0 +1,24 @@

+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-7b-chat-hf --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-7b_0.5 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-7b_0.5
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-7b-chat-hf --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-7b_0.6 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-7b_0.6
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-7b-chat-hf --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-7b_0.7 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-7b_0.7
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-7b-chat-hf --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-7b_0.8 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-7b_0.8
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-7b-chat-hf --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-7b_0.9 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-7b_0.9
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-7b-chat-hf --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-7b_0.95 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-7b_0.95
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-7b-chat-hf --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-7b_0.975 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-7b_0.975
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-13b-chat-hf --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-13b_0.5 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-13b_0.5
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-13b-chat-hf --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-13b_0.6 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-13b_0.6
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-13b-chat-hf --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-13b_0.7 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-13b_0.7
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-13b-chat-hf --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-13b_0.8 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-13b_0.8
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-13b-chat-hf --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-13b_0.9 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-13b_0.9
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-13b-chat-hf --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-13b_0.95 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-13b_0.95
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-13b-chat-hf --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-13b_0.975 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-13b_0.975
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-70b-chat-hf --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Llama-2-70b_0.5 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-70b_0.5
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-70b-chat-hf --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Llama-2-70b_0.6 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-70b_0.6
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-70b-chat-hf --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Llama-2-70b_0.7 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-70b_0.7
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-70b-chat-hf --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Llama-2-70b_0.8 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-70b_0.8
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-70b-chat-hf --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Llama-2-70b_0.9 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-70b_0.9
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-70b-chat-hf --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Llama-2-70b_0.95 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-70b_0.95
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-70b-chat-hf --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Llama-2-70b_0.975 --wandb_group llama-layer-search --save_dir results/search/layerwise/Llama-2-70b_0.975

llm-q-scaling-law-master/run_scripts/layerwise/llama_layerwise_run_commands.txt ADDED Viewed

	@@ -0,0 +1,32 @@

+python src/main.py --model_arch llama --model_name huggyllama/llama-7b --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-7b_0.5 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-7b_0.5
+python src/main.py --model_arch llama --model_name huggyllama/llama-7b --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-7b_0.6 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-7b_0.6
+python src/main.py --model_arch llama --model_name huggyllama/llama-7b --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-7b_0.7 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-7b_0.7
+python src/main.py --model_arch llama --model_name huggyllama/llama-7b --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-7b_0.8 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-7b_0.8
+python src/main.py --model_arch llama --model_name huggyllama/llama-7b --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-7b_0.9 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-7b_0.9
+python src/main.py --model_arch llama --model_name huggyllama/llama-7b --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-7b_0.95 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-7b_0.95
+python src/main.py --model_arch llama --model_name huggyllama/llama-7b --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-7b_0.975 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-7b_0.975
+python src/main.py --model_arch llama --model_name huggyllama/llama-13b --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-13b_0.5 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-13b_0.5
+python src/main.py --model_arch llama --model_name huggyllama/llama-13b --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-13b_0.6 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-13b_0.6
+python src/main.py --model_arch llama --model_name huggyllama/llama-13b --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-13b_0.7 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-13b_0.7
+python src/main.py --model_arch llama --model_name huggyllama/llama-13b --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-13b_0.8 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-13b_0.8
+python src/main.py --model_arch llama --model_name huggyllama/llama-13b --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-13b_0.9 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-13b_0.9
+python src/main.py --model_arch llama --model_name huggyllama/llama-13b --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-13b_0.95 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-13b_0.95
+python src/main.py --model_arch llama --model_name huggyllama/llama-13b --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-13b_0.975 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-13b_0.975
+python src/main.py --model_arch llama --model_name huggyllama/llama-30b --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-30b_0.5 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-30b_0.5
+python src/main.py --model_arch llama --model_name huggyllama/llama-30b --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-30b_0.6 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-30b_0.6
+python src/main.py --model_arch llama --model_name huggyllama/llama-30b --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-30b_0.7 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-30b_0.7
+python src/main.py --model_arch llama --model_name huggyllama/llama-30b --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-30b_0.8 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-30b_0.8
+python src/main.py --model_arch llama --model_name huggyllama/llama-30b --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-30b_0.9 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-30b_0.9
+python src/main.py --model_arch llama --model_name huggyllama/llama-30b --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-30b_0.95 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-30b_0.95
+python src/main.py --model_arch llama --model_name huggyllama/llama-30b --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-30b_0.975 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-30b_0.975
+python src/main.py --model_arch llama --model_name huggyllama/llama-65b --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-65b_0.5 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-65b_0.5
+python src/main.py --model_arch llama --model_name huggyllama/llama-65b --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-65b_0.6 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-65b_0.6
+python src/main.py --model_arch llama --model_name huggyllama/llama-65b --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-65b_0.7 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-65b_0.7
+python src/main.py --model_arch llama --model_name huggyllama/llama-65b --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-65b_0.8 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-65b_0.8
+python src/main.py --model_arch llama --model_name huggyllama/llama-65b --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-65b_0.9 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-65b_0.9
+python src/main.py --model_arch llama --model_name huggyllama/llama-65b --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-65b_0.95 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-65b_0.95
+python src/main.py --model_arch llama --model_name huggyllama/llama-65b --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-65b_0.975 --wandb_group llama-layer-search --save_dir results/search/layerwise/llama-65b_0.975

llm-q-scaling-law-master/run_scripts/layerwise/opt_layerwise_run_commands.txt ADDED Viewed

	@@ -0,0 +1,64 @@

+python src/main.py --model_arch opt --model_name facebook/opt-125m --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-125m_0.5 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-125m_0.5
+python src/main.py --model_arch opt --model_name facebook/opt-125m --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-125m_0.6 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-125m_0.6
+python src/main.py --model_arch opt --model_name facebook/opt-125m --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-125m_0.7 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-125m_0.7
+python src/main.py --model_arch opt --model_name facebook/opt-125m --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-125m_0.8 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-125m_0.8
+python src/main.py --model_arch opt --model_name facebook/opt-125m --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-125m_0.9 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-125m_0.9
+python src/main.py --model_arch opt --model_name facebook/opt-125m --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-125m_0.95 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-125m_0.95
+python src/main.py --model_arch opt --model_name facebook/opt-125m --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-125m_0.975 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-125m_0.975
+python src/main.py --model_arch opt --model_name facebook/opt-350m --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-350m_0.5 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-350m_0.5
+python src/main.py --model_arch opt --model_name facebook/opt-350m --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-350m_0.6 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-350m_0.6
+python src/main.py --model_arch opt --model_name facebook/opt-350m --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-350m_0.7 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-350m_0.7
+python src/main.py --model_arch opt --model_name facebook/opt-350m --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-350m_0.8 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-350m_0.8
+python src/main.py --model_arch opt --model_name facebook/opt-350m --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-350m_0.9 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-350m_0.9
+python src/main.py --model_arch opt --model_name facebook/opt-350m --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-350m_0.95 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-350m_0.95
+python src/main.py --model_arch opt --model_name facebook/opt-350m --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-350m_0.975 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-350m_0.975
+python src/main.py --model_arch opt --model_name facebook/opt-1.3b --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-1.3b_0.5 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-1.3b_0.5
+python src/main.py --model_arch opt --model_name facebook/opt-1.3b --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-1.3b_0.6 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-1.3b_0.6
+python src/main.py --model_arch opt --model_name facebook/opt-1.3b --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-1.3b_0.7 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-1.3b_0.7
+python src/main.py --model_arch opt --model_name facebook/opt-1.3b --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-1.3b_0.8 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-1.3b_0.8
+python src/main.py --model_arch opt --model_name facebook/opt-1.3b --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-1.3b_0.9 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-1.3b_0.9
+python src/main.py --model_arch opt --model_name facebook/opt-1.3b --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-1.3b_0.95 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-1.3b_0.95
+python src/main.py --model_arch opt --model_name facebook/opt-1.3b --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-1.3b_0.975 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-1.3b_0.975
+python src/main.py --model_arch opt --model_name facebook/opt-2.7b --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-2.7b_0.5 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-2.7b_0.5
+python src/main.py --model_arch opt --model_name facebook/opt-2.7b --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-2.7b_0.6 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-2.7b_0.6
+python src/main.py --model_arch opt --model_name facebook/opt-2.7b --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-2.7b_0.7 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-2.7b_0.7
+python src/main.py --model_arch opt --model_name facebook/opt-2.7b --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-2.7b_0.8 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-2.7b_0.8
+python src/main.py --model_arch opt --model_name facebook/opt-2.7b --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-2.7b_0.9 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-2.7b_0.9
+python src/main.py --model_arch opt --model_name facebook/opt-2.7b --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-2.7b_0.95 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-2.7b_0.95
+python src/main.py --model_arch opt --model_name facebook/opt-2.7b --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name opt-2.7b_0.975 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-2.7b_0.975
+python src/main.py --model_arch opt --model_name facebook/opt-6.7b --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --wandb_name opt-6.7b_0.5 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-6.7b_0.5
+python src/main.py --model_arch opt --model_name facebook/opt-6.7b --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --wandb_name opt-6.7b_0.6 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-6.7b_0.6
+python src/main.py --model_arch opt --model_name facebook/opt-6.7b --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --wandb_name opt-6.7b_0.7 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-6.7b_0.7
+python src/main.py --model_arch opt --model_name facebook/opt-6.7b --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --wandb_name opt-6.7b_0.8 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-6.7b_0.8
+python src/main.py --model_arch opt --model_name facebook/opt-6.7b --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --wandb_name opt-6.7b_0.9 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-6.7b_0.9
+python src/main.py --model_arch opt --model_name facebook/opt-6.7b --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --wandb_name opt-6.7b_0.95 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-6.7b_0.95
+python src/main.py --model_arch opt --model_name facebook/opt-6.7b --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --wandb_name opt-6.7b_0.975 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-6.7b_0.975
+python src/main.py --model_arch opt --model_name facebook/opt-13b --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name opt-13b_0.5 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-13b_0.5
+python src/main.py --model_arch opt --model_name facebook/opt-13b --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name opt-13b_0.6 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-13b_0.6
+python src/main.py --model_arch opt --model_name facebook/opt-13b --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name opt-13b_0.7 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-13b_0.7
+python src/main.py --model_arch opt --model_name facebook/opt-13b --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name opt-13b_0.8 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-13b_0.8
+python src/main.py --model_arch opt --model_name facebook/opt-13b --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name opt-13b_0.9 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-13b_0.9
+python src/main.py --model_arch opt --model_name facebook/opt-13b --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name opt-13b_0.95 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-13b_0.95
+python src/main.py --model_arch opt --model_name facebook/opt-13b --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name opt-13b_0.975 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-13b_0.975
+python src/main.py --model_arch opt --model_name facebook/opt-30b --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name opt-30b_0.5 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-30b_0.5
+python src/main.py --model_arch opt --model_name facebook/opt-30b --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name opt-30b_0.6 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-30b_0.6
+python src/main.py --model_arch opt --model_name facebook/opt-30b --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name opt-30b_0.7 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-30b_0.7
+python src/main.py --model_arch opt --model_name facebook/opt-30b --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name opt-30b_0.8 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-30b_0.8
+python src/main.py --model_arch opt --model_name facebook/opt-30b --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name opt-30b_0.9 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-30b_0.9
+python src/main.py --model_arch opt --model_name facebook/opt-30b --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name opt-30b_0.95 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-30b_0.95
+python src/main.py --model_arch opt --model_name facebook/opt-30b --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name opt-30b_0.975 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-30b_0.975
+python src/main.py --model_arch opt --model_name facebook/opt-66b --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name opt-66b_0.5 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-66b_0.5
+python src/main.py --model_arch opt --model_name facebook/opt-66b --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name opt-66b_0.6 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-66b_0.6
+python src/main.py --model_arch opt --model_name facebook/opt-66b --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name opt-66b_0.7 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-66b_0.7
+python src/main.py --model_arch opt --model_name facebook/opt-66b --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name opt-66b_0.8 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-66b_0.8
+python src/main.py --model_arch opt --model_name facebook/opt-66b --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name opt-66b_0.9 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-66b_0.9
+python src/main.py --model_arch opt --model_name facebook/opt-66b --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name opt-66b_0.95 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-66b_0.95
+python src/main.py --model_arch opt --model_name facebook/opt-66b --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name opt-66b_0.975 --wandb_group opt-layer-search --save_dir results/search/layerwise/opt-66b_0.975

llm-q-scaling-law-master/run_scripts/layerwise/qwen1.5_layerwise_run_commands.txt ADDED Viewed

	@@ -0,0 +1,64 @@

+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-0.5B --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name Qwen1.5-0.5B_0.5 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-0.5B_0.5
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-0.5B --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name Qwen1.5-0.5B_0.6 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-0.5B_0.6
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-0.5B --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name Qwen1.5-0.5B_0.7 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-0.5B_0.7
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-0.5B --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name Qwen1.5-0.5B_0.8 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-0.5B_0.8
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-0.5B --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name Qwen1.5-0.5B_0.9 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-0.5B_0.9
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-0.5B --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name Qwen1.5-0.5B_0.95 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-0.5B_0.95
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-0.5B --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name Qwen1.5-0.5B_0.975 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-0.5B_0.975
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-1.8B --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name Qwen1.5-1.8B_0.5 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-1.8B_0.5
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-1.8B --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name Qwen1.5-1.8B_0.6 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-1.8B_0.6
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-1.8B --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name Qwen1.5-1.8B_0.7 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-1.8B_0.7
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-1.8B --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name Qwen1.5-1.8B_0.8 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-1.8B_0.8
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-1.8B --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name Qwen1.5-1.8B_0.9 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-1.8B_0.9
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-1.8B --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name Qwen1.5-1.8B_0.95 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-1.8B_0.95
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-1.8B --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-8.toml --model_parallel --wandb_name Qwen1.5-1.8B_0.975 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-1.8B_0.975
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-4B --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --wandb_name Qwen1.5-4B_0.5 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-4B_0.5
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-4B --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --wandb_name Qwen1.5-4B_0.6 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-4B_0.6
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-4B --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --wandb_name Qwen1.5-4B_0.7 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-4B_0.7
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-4B --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --wandb_name Qwen1.5-4B_0.8 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-4B_0.8
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-4B --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --wandb_name Qwen1.5-4B_0.9 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-4B_0.9
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-4B --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --wandb_name Qwen1.5-4B_0.95 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-4B_0.95
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-4B --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-4.toml --model_parallel --wandb_name Qwen1.5-4B_0.975 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-4B_0.975
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-7B --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-7B_0.5 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-7B_0.5
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-7B --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-7B_0.6 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-7B_0.6
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-7B --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-7B_0.7 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-7B_0.7
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-7B --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-7B_0.8 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-7B_0.8
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-7B --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-7B_0.9 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-7B_0.9
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-7B --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-7B_0.95 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-7B_0.95
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-7B --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-7B_0.975 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-7B_0.975
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-14B --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-14B_0.5 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-14B_0.5
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-14B --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-14B_0.6 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-14B_0.6
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-14B --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-14B_0.7 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-14B_0.7
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-14B --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-14B_0.8 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-14B_0.8
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-14B --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-14B_0.9 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-14B_0.9
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-14B --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-14B_0.95 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-14B_0.95
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-14B --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-14B_0.975 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-14B_0.975
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-32B --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-32B_0.5 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-32B_0.5
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-32B --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-32B_0.6 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-32B_0.6
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-32B --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-32B_0.7 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-32B_0.7
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-32B --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-32B_0.8 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-32B_0.8
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-32B --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-32B_0.9 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-32B_0.9
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-32B --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-32B_0.95 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-32B_0.95
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-32B --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Qwen1.5-32B_0.975 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-32B_0.975
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-72B --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Qwen1.5-72B_0.5 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-72B_0.5
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-72B --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Qwen1.5-72B_0.6 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-72B_0.6
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-72B --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Qwen1.5-72B_0.7 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-72B_0.7
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-72B --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Qwen1.5-72B_0.8 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-72B_0.8
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-72B --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Qwen1.5-72B_0.9 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-72B_0.9
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-72B --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Qwen1.5-72B_0.95 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-72B_0.95
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-72B --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Qwen1.5-72B_0.975 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-72B_0.975
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-110B --q_ratio 0.5 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Qwen1.5-110B_0.5 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-110B_0.5
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-110B --q_ratio 0.6 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Qwen1.5-110B_0.6 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-110B_0.6
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-110B --q_ratio 0.7 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Qwen1.5-110B_0.7 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-110B_0.7
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-110B --q_ratio 0.8 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Qwen1.5-110B_0.8 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-110B_0.8
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-110B --q_ratio 0.9 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Qwen1.5-110B_0.9 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-110B_0.9
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-110B --q_ratio 0.95 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Qwen1.5-110B_0.95 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-110B_0.95
+python src/main.py --model_arch qwen1.5 --model_name Qwen/Qwen1.5-110B --q_ratio 0.975 --search_config configs/search/layerwise/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Qwen1.5-110B_0.975 --wandb_group qwen15-layer-search --save_dir results/search/layerwise/Qwen1.5-110B_0.975

llm-q-scaling-law-master/run_scripts/layerwise/runscript_generator.py ADDED Viewed

	@@ -0,0 +1,111 @@

+"""
+This generates the runscripts for the LLM-Q scaling law simulations.
+"""
+import os
+import argparse
+# the search command is
+#python src/main.py --model_name {model_name} --search_config configs/search/mxint_4bit-tinyllama.toml --model_parallel --disable_wandb --save_dir ../ckpt/test
+# the save dir is
+# results/search/layerwise/{model_name}_{ratio}
+granularity = ["transformer_layer"]
+# opt template for searching
+opt_model_sizes=["opt-125m","opt-350m","opt-1.3b","opt-2.7b","opt-6.7b","opt-13b","opt-30b","opt-66b"]
+opt_batch_size = [8,8,8,8,4,2,1,1]
+opt_layer_wise_ratios = [0.5,0.6,0.7,0.8,0.9,0.95,0.975]
+opt_layer_wise_search_config_template = "mxint_4bit-pajama-random-50-bs-{}.toml"
+opt_layer_wise_search_dir_template = "search/layerwise/{}_{}"
+opt_layerwise_run_command_palette = "python src/main.py --model_arch opt --model_name {model_name} --q_ratio {q_ratio} --search_config configs/search/layerwise/{search_config} --model_parallel --wandb_name {wandb_name} --wandb_group opt-layer-search --save_dir results/{save_dir}"
+with open("opt_layerwise_run_commands.txt", "w") as f:
+    for i in range(len(opt_model_sizes)):
+        model_size = opt_model_sizes[i]
+        model_batch_size = opt_batch_size[i]
+        for ratio in opt_layer_wise_ratios:
+            search_config = opt_layer_wise_search_config_template.format(model_batch_size)
+            save_dir = opt_layer_wise_search_dir_template.format(model_size, ratio)
+            model_name = f"facebook/{model_size}"
+            wandb_name = f"{model_size}_{ratio}"
+            run_command = opt_layerwise_run_command_palette.format(model_name=model_name, q_ratio=ratio, search_config=search_config, wandb_name=wandb_name, save_dir=save_dir)
+            # print(run_command)
+            f.write(run_command + "\n")
+        f.write("\n")
+# qwen template for searching
+qwen15_model_sizes=["Qwen1.5-0.5B","Qwen1.5-1.8B","Qwen1.5-4B","Qwen1.5-7B","Qwen1.5-14B","Qwen1.5-32B","Qwen1.5-72B","Qwen1.5-110B"]
+qwen15_batch_size = [8,8,4,2,2,2,1,1]
+qwen15_layer_wise_ratios = [0.5,0.6,0.7,0.8,0.9,0.95,0.975]
+qwen15_layer_wise_search_config_template = "mxint_4bit-pajama-random-50-bs-{}.toml"
+qwen15_layer_wise_search_dir_template = "search/layerwise/{}_{}"
+qwen15_layerwise_run_command_palette = "python src/main.py --model_arch qwen1.5 --model_name {model_name} --q_ratio {q_ratio} --search_config configs/search/layerwise/{search_config} --model_parallel --wandb_name {wandb_name} --wandb_group qwen15-layer-search --save_dir results/{save_dir}"
+with open("qwen1.5_layerwise_run_commands.txt", "w") as f:
+    for i in range(len(qwen15_model_sizes)):
+        model_size = qwen15_model_sizes[i]
+        model_batch_size = qwen15_batch_size[i]
+        for ratio in qwen15_layer_wise_ratios:
+            search_config = qwen15_layer_wise_search_config_template.format(model_batch_size)
+            save_dir = qwen15_layer_wise_search_dir_template.format(model_size, ratio)
+            model_name = f"Qwen/{model_size}"
+            wandb_name = f"{model_size}_{ratio}"
+            run_command = qwen15_layerwise_run_command_palette.format(model_name=model_name, q_ratio=ratio, search_config=search_config, wandb_name=wandb_name, save_dir=save_dir)
+            # print(run_command)
+            f.write(run_command + "\n")
+        f.write("\n")
+# llama template for searching
+# qwen template for searching
+llama_model_sizes=["llama-7b","llama-13b","llama-30b","llama-65b"]
+llama_batch_size = [2,2,1,1]
+llama_layer_wise_ratios = [0.5,0.6,0.7,0.8,0.9,0.95,0.975]
+llama_layer_wise_search_config_template = "mxint_4bit-pajama-random-50-bs-{}.toml"
+llama_layer_wise_search_dir_template = "search/layerwise/{}_{}"
+llama_layerwise_run_command_palette = "python src/main.py --model_arch llama --model_name {model_name} --q_ratio {q_ratio} --search_config configs/search/layerwise/{search_config} --model_parallel --wandb_name {wandb_name} --wandb_group llama-layer-search --save_dir results/{save_dir}"
+with open("llama_layerwise_run_commands.txt", "w") as f:
+    for i in range(len(llama_model_sizes)):
+        model_size = llama_model_sizes[i]
+        model_batch_size = llama_batch_size[i]
+        for ratio in llama_layer_wise_ratios:
+            search_config = llama_layer_wise_search_config_template.format(model_batch_size)
+            save_dir = llama_layer_wise_search_dir_template.format(model_size, ratio)
+            model_name = f"huggyllama/{model_size}"
+            wandb_name = f"{model_size}_{ratio}"
+            run_command = llama_layerwise_run_command_palette.format(model_name=model_name, q_ratio=ratio, search_config=search_config, wandb_name=wandb_name, save_dir=save_dir)
+            # print(run_command)
+            f.write(run_command + "\n")
+        f.write("\n")
+llama2_model_sizes=["Llama-2-7b","Llama-2-13b","Llama-2-70b"]
+llama2_batch_size = [2,2,1,1]
+llama2_layer_wise_ratios = [0.5,0.6,0.7,0.8,0.9,0.95,0.975]
+llama2_layer_wise_search_config_template = "mxint_4bit-pajama-random-50-bs-{}.toml"
+llama2_layer_wise_search_dir_template = "search/layerwise/{}_{}"
+llama2_layerwise_run_command_palette = "python src/main.py --model_arch llama2 --model_name {model_name} --q_ratio {q_ratio} --search_config configs/search/layerwise/{search_config} --model_parallel --wandb_name {wandb_name} --wandb_group llama-layer-search --save_dir results/{save_dir}"
+with open("llama2_layerwise_run_commands.txt", "w") as f:
+    for i in range(len(llama2_model_sizes)):
+        model_size = llama2_model_sizes[i]
+        model_batch_size = llama2_batch_size[i]
+        for ratio in llama2_layer_wise_ratios:
+            search_config = llama2_layer_wise_search_config_template.format(model_batch_size)
+            save_dir = llama2_layer_wise_search_dir_template.format(model_size, ratio)
+            model_name = f"meta-llama/{model_size}-chat-hf" # use the instruction tempalte
+            wandb_name = f"{model_size}_{ratio}"
+            run_command = llama2_layerwise_run_command_palette.format(model_name=model_name, q_ratio=ratio, search_config=search_config, wandb_name=wandb_name, save_dir=save_dir)
+            # print(run_command)
+            f.write(run_command + "\n")
+        f.write("\n")

llm-q-scaling-law-master/run_scripts/matmult/llama2_matmult_run_commands.txt ADDED Viewed

	@@ -0,0 +1,18 @@

+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-7b-chat-hf --q_ratio 0.5 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-7b_0.5 --wandb_group llama-layer-search --save_dir results/search/matmult/Llama-2-7b_0.5
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-7b-chat-hf --q_ratio 0.9 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-7b_0.9 --wandb_group llama-layer-search --save_dir results/search/matmult/Llama-2-7b_0.9
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-7b-chat-hf --q_ratio 0.95 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-7b_0.95 --wandb_group llama-layer-search --save_dir results/search/matmult/Llama-2-7b_0.95
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-7b-chat-hf --q_ratio 0.975 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-7b_0.975 --wandb_group llama-layer-search --save_dir results/search/matmult/Llama-2-7b_0.975
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-7b-chat-hf --q_ratio 0.99 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-7b_0.99 --wandb_group llama-layer-search --save_dir results/search/matmult/Llama-2-7b_0.99
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-13b-chat-hf --q_ratio 0.5 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-13b_0.5 --wandb_group llama-layer-search --save_dir results/search/matmult/Llama-2-13b_0.5
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-13b-chat-hf --q_ratio 0.9 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-13b_0.9 --wandb_group llama-layer-search --save_dir results/search/matmult/Llama-2-13b_0.9
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-13b-chat-hf --q_ratio 0.95 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-13b_0.95 --wandb_group llama-layer-search --save_dir results/search/matmult/Llama-2-13b_0.95
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-13b-chat-hf --q_ratio 0.975 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-13b_0.975 --wandb_group llama-layer-search --save_dir results/search/matmult/Llama-2-13b_0.975
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-13b-chat-hf --q_ratio 0.99 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name Llama-2-13b_0.99 --wandb_group llama-layer-search --save_dir results/search/matmult/Llama-2-13b_0.99
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-70b-chat-hf --q_ratio 0.5 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Llama-2-70b_0.5 --wandb_group llama-layer-search --save_dir results/search/matmult/Llama-2-70b_0.5
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-70b-chat-hf --q_ratio 0.9 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Llama-2-70b_0.9 --wandb_group llama-layer-search --save_dir results/search/matmult/Llama-2-70b_0.9
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-70b-chat-hf --q_ratio 0.95 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Llama-2-70b_0.95 --wandb_group llama-layer-search --save_dir results/search/matmult/Llama-2-70b_0.95
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-70b-chat-hf --q_ratio 0.975 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Llama-2-70b_0.975 --wandb_group llama-layer-search --save_dir results/search/matmult/Llama-2-70b_0.975
+python src/main.py --model_arch llama2 --model_name meta-llama/Llama-2-70b-chat-hf --q_ratio 0.99 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name Llama-2-70b_0.99 --wandb_group llama-layer-search --save_dir results/search/matmult/Llama-2-70b_0.99

llm-q-scaling-law-master/run_scripts/matmult/llama_matmult_run_commands.txt ADDED Viewed

	@@ -0,0 +1,24 @@

+python src/main.py --model_arch llama --model_name huggyllama/llama-7b --q_ratio 0.5 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-7b_0.5 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-7b_0.5
+python src/main.py --model_arch llama --model_name huggyllama/llama-7b --q_ratio 0.9 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-7b_0.9 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-7b_0.9
+python src/main.py --model_arch llama --model_name huggyllama/llama-7b --q_ratio 0.95 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-7b_0.95 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-7b_0.95
+python src/main.py --model_arch llama --model_name huggyllama/llama-7b --q_ratio 0.975 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-7b_0.975 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-7b_0.975
+python src/main.py --model_arch llama --model_name huggyllama/llama-7b --q_ratio 0.99 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-7b_0.99 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-7b_0.99
+python src/main.py --model_arch llama --model_name huggyllama/llama-13b --q_ratio 0.5 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-13b_0.5 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-13b_0.5
+python src/main.py --model_arch llama --model_name huggyllama/llama-13b --q_ratio 0.9 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-13b_0.9 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-13b_0.9
+python src/main.py --model_arch llama --model_name huggyllama/llama-13b --q_ratio 0.95 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-13b_0.95 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-13b_0.95
+python src/main.py --model_arch llama --model_name huggyllama/llama-13b --q_ratio 0.975 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-13b_0.975 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-13b_0.975
+python src/main.py --model_arch llama --model_name huggyllama/llama-13b --q_ratio 0.99 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-2.toml --model_parallel --wandb_name llama-13b_0.99 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-13b_0.99
+python src/main.py --model_arch llama --model_name huggyllama/llama-30b --q_ratio 0.5 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-30b_0.5 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-30b_0.5
+python src/main.py --model_arch llama --model_name huggyllama/llama-30b --q_ratio 0.9 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-30b_0.9 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-30b_0.9
+python src/main.py --model_arch llama --model_name huggyllama/llama-30b --q_ratio 0.95 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-30b_0.95 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-30b_0.95
+python src/main.py --model_arch llama --model_name huggyllama/llama-30b --q_ratio 0.975 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-30b_0.975 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-30b_0.975
+python src/main.py --model_arch llama --model_name huggyllama/llama-30b --q_ratio 0.99 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-30b_0.99 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-30b_0.99
+python src/main.py --model_arch llama --model_name huggyllama/llama-65b --q_ratio 0.5 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-65b_0.5 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-65b_0.5
+python src/main.py --model_arch llama --model_name huggyllama/llama-65b --q_ratio 0.9 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-65b_0.9 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-65b_0.9
+python src/main.py --model_arch llama --model_name huggyllama/llama-65b --q_ratio 0.95 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-65b_0.95 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-65b_0.95
+python src/main.py --model_arch llama --model_name huggyllama/llama-65b --q_ratio 0.975 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-65b_0.975 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-65b_0.975
+python src/main.py --model_arch llama --model_name huggyllama/llama-65b --q_ratio 0.99 --search_config configs/search/matmult/mxint_4bit-pajama-random-50-bs-1.toml --model_parallel --wandb_name llama-65b_0.99 --wandb_group llama-matmult-search --save_dir results/search/matmult/llama-65b_0.99