wangclnlp
/

GRAM-RR-LLaMA-3.2-3B-RewardModel

Text Generation

RewardReasoning

Model card Files Files and versions

wangclnlp commited on 24 days ago

Commit

a559cc7

·

verified ·

1 Parent(s): a9a7dc9

Upload folder using huggingface_hub

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -59,7 +59,7 @@ We evaluate our model on two challenging reward benchmarks, [RM-Bench](https://g
 - Results on the JudgeBench.
-  | **Model** | **Params.** | **Chat** | **Math** | **Code** | **Safety** | **Overall** |
   |:-|-:|:-:|:-:|:-:|:-:|:-:|
   |**LLM-as-a-Judge**||||||
   |GPT-4o           |-   |50.6 |  54.1 |  75.0 |  59.5 | 59.8 |

 - Results on the JudgeBench.
+  | **Model** | **Params.** | **Knowl.** | **Reason.** | **Math** | **Coding** | **Overall** |
   |:-|-:|:-:|:-:|:-:|:-:|:-:|
   |**LLM-as-a-Judge**||||||
   |GPT-4o           |-   |50.6 |  54.1 |  75.0 |  59.5 | 59.8 |