Llama 3.3 - a AmpereComputing Collection

AmpereComputing 's Collections

Llama 3.3

updated Sep 12, 2025

Ampere's quantization formats (Q4_K_4 / Q8R16) require Ampere optimized llama.cpp available here: https://hub.docker.com/r/amperecomputingai/llama.cpp

AmpereComputing/llama-3.3-70b-instruct-gguf

71B • Updated Aug 14, 2025 • 1