Jake5
/

Qwen2.5-Coder-32B-Instruct-WMX

text-generation-inference

Model card Files Files and versions

Jake5 commited on 25 days ago

Commit

42a3a14

·

verified ·

1 Parent(s): b2a0fc1

Update model card for v0.9

Files changed (1) hide show

README.md +6 -5

README.md CHANGED Viewed

@@ -1,3 +1,4 @@
 ---
 base_model: unsloth/Qwen2.5-Coder-32B-Instruct-bnb-4bit
 tags:
@@ -19,25 +20,25 @@ Pre-fine-tuned LoRA adapters for unsloth/Qwen2.5-Coder-32B-Instruct.
 - https://huggingface.co/datasets/Jake5/wmx-doc-user
 - https://huggingface.co/datasets/Jake5/wmx-doc-robot
-## Version v0.8
 - Source: lora_model
 - Base model: unsloth/Qwen2.5-Coder-32B-Instruct
-- Uploaded on: 2025-09-11
 ## Usage
 ```python
 from peft import PeftModel
 from transformers import AutoModelForCausalLM, AutoTokenizer
 base_model = AutoModelForCausalLM.from_pretrained("unsloth/Qwen2.5-Coder-32B-Instruct")
-model = PeftModel.from_pretrained(base_model, "Jake5/Qwen2.5-Coder-32B-Instruct-WMX", subfolder="adapters_v0.8")
-tokenizer = AutoTokenizer.from_pretrained("Jake5/Qwen2.5-Coder-32B-Instruct-WMX", subfolder="adapters_v0.8")
 ```
 ## vLLM Serving
 ```bash
 python -m vllm.entrypoints.openai.api_server \
     --model unsloth/Qwen2.5-Coder-32B-Instruct \
-    --lora-modules my-lora=Jake5/Qwen2.5-Coder-32B-Instruct-WMX/adapters_v0.8 \
     --dtype bfloat16 \
     --port 8000
 ```

 ---
 base_model: unsloth/Qwen2.5-Coder-32B-Instruct-bnb-4bit
 tags:
 - https://huggingface.co/datasets/Jake5/wmx-doc-user
 - https://huggingface.co/datasets/Jake5/wmx-doc-robot
+## Version v0.9
 - Source: lora_model
 - Base model: unsloth/Qwen2.5-Coder-32B-Instruct
+- Uploaded on: 2025-09-12
 ## Usage
 ```python
 from peft import PeftModel
 from transformers import AutoModelForCausalLM, AutoTokenizer
 base_model = AutoModelForCausalLM.from_pretrained("unsloth/Qwen2.5-Coder-32B-Instruct")
+model = PeftModel.from_pretrained(base_model, "Jake5/Qwen2.5-Coder-32B-Instruct-WMX", subfolder="adapters_v0.9")
+tokenizer = AutoTokenizer.from_pretrained("Jake5/Qwen2.5-Coder-32B-Instruct-WMX", subfolder="adapters_v0.9")
 ```
 ## vLLM Serving
 ```bash
 python -m vllm.entrypoints.openai.api_server \
     --model unsloth/Qwen2.5-Coder-32B-Instruct \
+    --lora-modules my-lora=Jake5/Qwen2.5-Coder-32B-Instruct-WMX/adapters_v0.9 \
     --dtype bfloat16 \
     --port 8000
 ```