Zizhuo Zhang's picture

29 2 2

Zizhuo Zhang PRO

resistz

·

resistzzz

AI & ML interests

None yet

Recent Activity

updated a model 4 days ago

resistz/GT-GRPO_Llama-3.2-3B-Instruct_NQ-HotpotQA

published a model 4 days ago

resistz/GT-GRPO_Llama-3.2-3B-Instruct_NQ-HotpotQA

updated a model 4 days ago

TMLR-Group-HF/Co-rewarding-III-Llama-3.2-3B-Instruct-DAPO14k

View all activity

Organizations

Collections 1

models 10

resistz/GT-GRPO_Llama-3.2-3B-Instruct_NQ-HotpotQA

Updated 4 days ago

resistz/sft_Llama-3.2-1B_ultra200k

Text Generation • 0.3B • Updated Aug 19 • 5

resistz/sft_Qwen3-8B-Base_ultra200k_merged

8B • Updated Aug 19 • 6

resistz/sft_Qwen3-8B-Base_ultra200k_lora32

Text Generation • Updated Aug 19 • 1

resistz/sft_Qwen3-4B-Base_ultra200k

Text Generation • 1B • Updated Aug 19 • 5

resistz/sft_Qwen3-1.7B-Base_ultra200k

Text Generation • 0.4B • Updated Aug 19 • 6

resistz/sft_Qwen3-0.6B-Base_ultra200k

Text Generation • 0.8B • Updated Aug 19 • 4

resistz/sft_Llama-3.2-3B_ultra200k

Text Generation • 0.8B • Updated Aug 19 • 7

resistz/sft_Llama-3.1-8B_ultra200k_merged

8B • Updated Aug 13 • 5

resistz/sft_Llama-3.1-8B_ultra200k_lora

Text Generation • Updated Aug 13 • 1

datasets 0

None public yet