Edit Models filters

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

83

Full-text search

Active filters: quark

matmelis/Llama_3.2_1B_w_uint4_autosmoothquant_gptq

0.4B • Updated Aug 1 • 10

matmelis/Llama_3.2_1B_w_uint4_qronos

0.4B • Updated Aug 7 • 9

matmelis/Llama_3.2_3B_w_mxfp4_a_mxfp4_qronos

2B • Updated Aug 7 • 16

EliovpAI/Qwen3-0.6B-FP8-KV

Text Generation • 0.6B • Updated Aug 2 • 9

matmelis/Llama_3.2_3B_w_mxfp4_a_mxfp4_gptq

2B • Updated Aug 6 • 16

matmelis/Llama_3.2_1B_w_int3_qronos

0.6B • Updated about 1 month ago • 12

matmelis/Llama_3.2_3B_w_uint4_qronos

0.8B • Updated Aug 7 • 10

matmelis/Llama_3.2_3B_w_int3_qronos

1B • Updated about 1 month ago • 12

matmelis/Llama_3.2_3B_w_int2_gptq

3B • Updated Aug 7 • 10

matmelis/Llama_3.2_3B_w_int3_gptq

3B • Updated Aug 7 • 8

matmelis/Llama_3.2_3B_w_int2_qronos

3B • Updated Aug 7 • 10

matmelis/Llama_3.2_1B_w_int3_gptq

0.6B • Updated Aug 11 • 11

matmelis/Llama_3.2_3B_w_uint4_gptq

0.8B • Updated Aug 7 • 9

matmelis/Llama_3.2_1B_w_int2_qronos

1B • Updated Aug 7 • 11

matmelis/Llama_3.2_1B_w_int2_gptq

1B • Updated Aug 7 • 9

matmelis/Llama_3.2_1B_w_uint4_smoothquant_qronos

0.4B • Updated Aug 7 • 10

haoyang-amd/output_oss_120b_moe_w_mxfp4_a_mxfp4

174B • Updated 23 days ago • 7

haoyang-amd/output_oss_20b_moe_w_mxfp4_a_bfloat16

11B • Updated 22 days ago • 11

matmelis/Llama_3.2_1B_w_mxfp4_a_mxfp4_gptq

0.8B • Updated 22 days ago • 7

matmelis/Llama_3.2_1B_w_mxfp4_a_mxfp4_qronos

0.8B • Updated 22 days ago • 8

amd/DeepSeek-V3-0324-WMXFP4-AMXFP4-MoE-Quant-ASQ

342B • Updated 17 days ago • 58

Keozon/GLM-4.5-Air-fp8_e4m3-quark-gfx1100

107B • Updated 10 days ago • 8

amd/Qwen2.5-1.5B-Instruct-ptpc-Quark-ts

2B • Updated about 6 hours ago