thejaminator
/

feature-vector-31aug-entropy-step-100

Text Generation

Model card Files Files and versions

feature-vector-31aug-entropy-step-100 / README.md

thejaminator's picture

verl GRPO trained model at step 100

1f8e02a verified about 1 month ago

|

135 Bytes

metadata

base_model: thejaminator/qwen-hook-layer-9-posneg-merged
library_name: peft
tags:
  - lora
  - peft
pipeline_tag: text-generation