JakeOh (Seunghyuk Oh)

arxiv:2505.20698

arxiv:2502.14565

arxiv:2404.10308

models 30

datasets 29

JakeOh/gsm8k

Viewer • Updated 29 days ago • 127k • 173

JakeOh/iself-mbpp

Viewer • Updated Mar 31 • 3.06k • 35

JakeOh/rft-llama-3.2-1b-instruct-gsm240k-k1

Viewer • Updated Jan 30 • 667k • 15

JakeOh/rft-finetune-llama-3.1-8b-math

Viewer • Updated Jan 30 • 182k • 14

JakeOh/rft-finetune-llama-3.2-1b-math

Viewer • Updated Jan 29 • 172k • 13

JakeOh/rft-finetune-llama-3.2-1b-math-k10

Viewer • Updated Jan 29 • 351k • 9

JakeOh/rft-finetune-llama-3.2-1b-gsm8k

Viewer • Updated Jan 29 • 31.8k • 10

JakeOh/rft-llama-3.2-1b-instruct-gsm8k

Viewer • Updated Jan 29 • 48.7k • 4

JakeOh/star_plus-llama-3.1-8b-math50k-step-3

Updated Jan 29 • 4

JakeOh/star_plus-llama-3.1-8b-math50k-step-2

Updated Jan 29 • 3

View 29 datasets

Seunghyuk Oh

AI & ML interests

Organizations

Collections 1

JakeOh/llama-3.2-1b-gsm8k-step-0-sft

JakeOh/llama-3.2-1b-gsm8k-step-1-dpo

JakeOh/llama-3.2-1b-gsm8k-step-2-dpo

JakeOh/gsm8k

JakeOh/llama-3.2-1b-gsm8k-step-0-sft

JakeOh/llama-3.2-1b-gsm8k-step-1-dpo

JakeOh/llama-3.2-1b-gsm8k-step-2-dpo

JakeOh/gsm8k

Papers 4

models 30

JakeOh/sedd-small-uniform

JakeOh/llama-3.2-1b-gsm8k-step-2-dpo

JakeOh/llama-3.2-1b-gsm8k-step-1-dpo

JakeOh/llama-3.2-1b-gsm8k-step-0-sft

JakeOh/llama-3.2-1b-sft-gsm8k

JakeOh/rft-llama-3.2-1b-instruct-gsm240k-k1

JakeOh/rft-finetune-llama-3.1-8b-math

JakeOh/rft-finetune-llama-3.2-1b-math

JakeOh/finetune-llama-3.1-8b-math50k

JakeOh/rft-finetune-llama-3.2-1b-gsm8k

datasets 29

JakeOh/gsm8k

JakeOh/iself-mbpp

JakeOh/rft-llama-3.2-1b-instruct-gsm240k-k1

JakeOh/rft-finetune-llama-3.1-8b-math

JakeOh/rft-finetune-llama-3.2-1b-math

JakeOh/rft-finetune-llama-3.2-1b-math-k10

JakeOh/rft-finetune-llama-3.2-1b-gsm8k

JakeOh/rft-llama-3.2-1b-instruct-gsm8k

JakeOh/star_plus-llama-3.1-8b-math50k-step-3

JakeOh/star_plus-llama-3.1-8b-math50k-step-2

Seunghyuk Oh

AI & ML interests

Organizations

Collections 1

Papers 4

models 30 Sort: Recently updated

datasets 29 Sort: Recently updated

models 30

datasets 29