FutureMa
/

Qwen2.5-7B-Instruct-GRPO-Math

Text Generation

Model card Files Files and versions

Qwen2.5-7B-Instruct-GRPO-Math

243 MB

1 contributor

History: 2 commits

FutureMa's picture

Upload GRPO fine-tuned Qwen2.5-7B-Instruct model

bc4cc58 verified 17 days ago

.gitattributes
1.52 kB

initial commit 17 days ago
README.md
3.38 kB

Upload GRPO fine-tuned Qwen2.5-7B-Instruct model 17 days ago
adapter_config.json
1.1 kB

Upload GRPO fine-tuned Qwen2.5-7B-Instruct model 17 days ago
adapter_model.safetensors
80.8 MB
xet

Upload GRPO fine-tuned Qwen2.5-7B-Instruct model 17 days ago
additional_config.json
67 Bytes

Upload GRPO fine-tuned Qwen2.5-7B-Instruct model 17 days ago
args.json
31.7 kB

Upload GRPO fine-tuned Qwen2.5-7B-Instruct model 17 days ago
optimizer.pt
162 MB
xet

Upload GRPO fine-tuned Qwen2.5-7B-Instruct model 17 days ago
rng_state.pth
14.6 kB
xet

Upload GRPO fine-tuned Qwen2.5-7B-Instruct model 17 days ago
scheduler.pt
1.47 kB
xet

Upload GRPO fine-tuned Qwen2.5-7B-Instruct model 17 days ago
trainer_state.json
83.2 kB

Upload GRPO fine-tuned Qwen2.5-7B-Instruct model 17 days ago
training_args.bin
10 kB
xet

Upload GRPO fine-tuned Qwen2.5-7B-Instruct model 17 days ago