Edit Models filters

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

3,925

Full-text search

Active filters: quantized

DevParker/VibeVoice7b-low-vram

Text-to-Speech • Updated 10 days ago • 26

MaziyarPanahi/Mistral-7B-Instruct-v0.3-GGUF

Text Generation • 7B • Updated May 22, 2024 • 166k • 112

nvidia/gpt-oss-120b-Eagle3

Text Generation • 0.2B • Updated 8 days ago • 1.05k • 23

QuantStack/Wan2.1_T2V_14B_FusionX_VACE-GGUF

Image-to-Video • 17B • Updated Jun 12 • 15.6k • 51

sugiv/cardvaultplus-500m-gguf

Image-to-Text • 0.4B • Updated Jul 22 • 252 • 2

helizac/dots.ocr-4bit

Image-to-Text • 2B • Updated Aug 6 • 1.07k • 16

asmud/indonesian-embedding-small

Sentence Similarity • Updated 6 days ago • 2

argmaxinc/whisperkit-coreml

Automatic Speech Recognition • Updated May 18 • 394k • 138

Green-Sky/bark-ggml

Updated Apr 22, 2024 • 7

Lewdiculous/Aura_v2_7B-GGUF-IQ-Imatrix

7B • Updated Apr 16, 2024 • 249 • 15

argmaxinc/whisperkit-mlx

Updated Aug 10, 2024 • 1

MaziyarPanahi/Qwen2.5-7B-Instruct-GGUF

Text Generation • 8B • Updated Sep 18, 2024 • 143k • 11

argmaxinc/speakerkit-pro

Automatic Speech Recognition • Updated May 1 • 18

MaziyarPanahi/Qwen2.5-Coder-0.5B-QwQ-draft-GGUF

Text Generation • 0.5B • Updated Jan 7 • 255 • 4

MaziyarPanahi/gemma-3-4b-it-GGUF

Text Generation • 4B • Updated Mar 12 • 146k • 11

MaziyarPanahi/gemma-3-27b-it-GGUF

Text Generation • 27B • Updated Mar 16 • 140k • 7

nvidia/Llama-4-Scout-17B-16E-Instruct-FP8

109B • Updated 15 days ago • 14k • 4

ABDALLALSWAITI/FLUX.1-dev-ControlNet-Union-Pro-2.0-fp8

Text-to-Image • Updated Apr 19 • 6.77k • 45

phazei/phazei-SkyReels-V2-fp8-e5m2

Text-to-Video • Updated May 25 • 3

argmaxinc/parakeetkit-pro

Automatic Speech Recognition • Updated 28 days ago • 57.6k • 4

nvidia/DeepSeek-R1-0528-FP4

Text Generation • Updated 20 days ago • 51.8k • 36

botirk/tiny-prompt-task-complexity-classifier

Text Classification • Updated Jun 12 • 6 • 2

mzbac/flux1.kontext.8bit.mlx

Image-to-Image • Updated Jul 6 • 2

nvidia/Qwen3-30B-A3B-FP4

Text Generation • 16B • Updated 1 day ago • 1.39k • 2

JonathanMiddleton/Qwen3-Embedding-8B-GGUF

8B • Updated Jul 14 • 802 • 3

nvidia/DeepSeek-R1-0528-FP4-v2

Text Generation • 394B • Updated 9 days ago • 18.5k • 4

NVFP4/Qwen3-235B-A22B-Instruct-2507-FP4

Text Generation • Updated Jul 23 • 709 • 1

nvidia/Qwen3-235B-A22B-Eagle3

Text Generation • 0.3B • Updated 8 days ago • 133 • 3

mlx-community/GLM-4.5-MLX-8bit

Text Generation • Updated 26 days ago • 3

beenyb/financial-gpt-oss-20b-q8

Text Generation • 12B • Updated 9 days ago • 849 • 1