Edit Models filters

Apps

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

audio-text-to-text

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

294

Full-text search

Active filters: audio-text-to-text

stepfun-ai/Step-Audio-R1

Audio-Text-to-Text • 33B • Updated 1 day ago • 315 • 110

nvidia/music-flamingo-hf

Audio-Text-to-Text • 8B • Updated 14 days ago • 8.44k • 48

nvidia/audio-flamingo-3-hf

Audio-Text-to-Text • 8B • Updated 3 days ago • 6.51k • 129

NexaAI/OmniAudio-2.6B

Audio-Text-to-Text • 3B • Updated Dec 13, 2024 • 1.01k • 280

google/gemma-3n-E4B

Image-Text-to-Text • 8B • Updated Jul 14 • 6.31k • 109

google/gemma-3n-E4B-it

Image-Text-to-Text • 8B • Updated Jul 14 • 67k • 823

mistralai/Voxtral-Small-24B-2507

Audio-Text-to-Text • 24B • Updated Jul 28 • 5.86k • 434

nvidia/audio-flamingo-3

Audio-Text-to-Text • Updated 5 days ago • 1.12k • 134

Qwen/Qwen-Audio

Text Generation • 8B • Updated Nov 20, 2024 • 2.65k • 142

Qwen/Qwen2-Audio-7B

Audio-Text-to-Text • 8B • Updated Nov 20, 2024 • 54.1k • 154

google/gemma-3n-E2B

Image-Text-to-Text • 5B • Updated Jul 14 • 1.36k • 79

allenai/OLMoASR

Audio-Text-to-Text • Updated Aug 28 • 68

NexaAI/Qwen2-Audio-7B-GGUF

Audio-Text-to-Text • 8B • Updated Nov 25, 2024 • 7.68k • 166

Menlo/Ichigo-whisper-v0.1

Audio-Text-to-Text • Updated Jan 3 • 26

fixie-ai/ultravox-v0_5-llama-3_2-1b

Audio-Text-to-Text • 0.7B • Updated 7 days ago • 382k • 62

SeaLLMs/SeaLLMs-Audio-7B

Audio-Text-to-Text • 8B • Updated Mar 17 • 360 • 18

fixie-ai/ultravox-v0_6-llama-3_1-8b

Audio-Text-to-Text • 0.7B • Updated Jul 5 • 6.27k • 4

google/gemma-3n-E2B-it

Image-Text-to-Text • 5B • Updated Jul 14 • 118k • 238

mispeech/midashenglm-7b-0804-fp32

Audio-Text-to-Text • 8B • Updated Oct 31 • 33.1k • 75

bartowski/google_gemma-3n-E4B-it-GGUF

Text Generation • 7B • Updated Jun 27 • 7.3k • 17

mradermacher/gemma-3n-E4B-it-i1-GGUF

Automatic Speech Recognition • 7B • Updated Jul 11 • 124 • 1

onnx-community/Voxtral-Mini-3B-2507-ONNX

Audio-Text-to-Text • Updated Jul 24 • 238 • 26

Yi3852/MuFun-Base

Audio-Text-to-Text • 9B • Updated Aug 9 • 8 • 2

bubblspace/Timecapsule2.7B-g3n-mix-match

Image-Text-to-Text • 7B • Updated Aug 6 • 4 • 1

mispeech/midashenglm-7b-1021-bf16

Audio-Text-to-Text • 8B • Updated 22 days ago • 647 • 2

Qwen/Qwen-Audio-Chat

Text Generation • 8B • Updated Jan 12 • 1.53k • 94

fixie-ai/ultravox-v0_2

Audio-Text-to-Text • 8B • Updated May 6 • 458 • 51

fixie-ai/ultravox-v0_3

Audio-Text-to-Text • 8B • Updated May 6 • 533 • 17

Qwen/Qwen2-Audio-7B-Instruct

Audio-Text-to-Text • 8B • Updated Jan 12 • 195k • 497

sarvamai/shuka-1

Audio-Text-to-Text • 9B • Updated Mar 14 • 213 • 75