RedHatAI
/

gpt-oss-120b-FP8-dynamic

Text Generation

compressed-tensors

text-generation-inference

Model card Files Files and versions

Resources

View closed (1)

Model does not generate tokens when served with 4 RTX 6000 ADA GPUs on vLLM

#4 opened 13 days ago by

gptq int4 MIX int 8 please please please champs!

#3 opened 14 days ago by

seems stuck on last steps

#1 opened 25 days ago by