94 56 407

Florian Zimmermeister PRO

flozi00

AI & ML interests

ASR, German LLM

Recent Activity

upvoted a paper about 6 hours ago

Set Block Decoding is a Language Model Inference Accelerator

liked a dataset 1 day ago

nvidia/Nemotron-CC-v2

liked a dataset 1 day ago

HuggingFaceFW/finepdfs

View all activity

Organizations

$A\\Ware's profile picture$

upvoted a paper about 6 hours ago

Set Block Decoding is a Language Model Inference Accelerator

Paper • 2509.04185 • Published 5 days ago • 32

upvoted a paper 11 days ago

Beyond Transcription: Mechanistic Interpretability in ASR

Paper • 2508.15882 • Published 19 days ago • 84

upvoted a paper 13 days ago

MeshCoder: LLM-Powered Structured Mesh Code Generation from Point Clouds

Paper • 2508.14879 • Published 19 days ago • 64

upvoted a paper 15 days ago

DINOv3

Paper • 2508.10104 • Published 26 days ago • 242

upvoted a paper about 1 month ago

Persona Vectors: Monitoring and Controlling Character Traits in Language Models

Paper • 2507.21509 • Published Jul 29 • 29

upvoted a collection 2 months ago

Red Hat AI validated models - v1.0

Collection

v1.0 Collection of third-party generative AI models validated by Red Hat AI for use across the Red Hat AI Product Portfolio. • 39 items • Updated Jul 29 • 17

upvoted a paper 4 months ago

Quartet: Native FP4 Training Can Be Optimal for Large Language Models

Paper • 2505.14669 • Published May 20 • 78

upvoted 2 papers 5 months ago

ReTool: Reinforcement Learning for Strategic Tool Use in LLMs

Paper • 2504.11536 • Published Apr 15 • 62

BitNet b1.58 2B4T Technical Report

Paper • 2504.12285 • Published Apr 16 • 74

upvoted a collection 5 months ago

Model Optimizer

Collection

A collection of generative models quantized and optimized with TensorRT Model Optimizer. • 37 items • Updated 4 days ago • 29

upvoted a paper 5 months ago

AdaptiVocab: Enhancing LLM Efficiency in Focused Domains through Lightweight Vocabulary Adaptation

Paper • 2503.19693 • Published Mar 25 • 77

upvoted an article 6 months ago

Article

Open R1: Update #3

and 9 others •

Mar 11

• 295

upvoted a collection 6 months ago

Multilingual LLM Evaluation

Collection

Multilingual Evaluation Benchmarks • 8 items • Updated Jul 31 • 27

upvoted an article 6 months ago

Article

Open-source DeepResearch – Freeing our search agents

and 4 others •

Feb 4

• 1.29k

upvoted 3 papers 6 months ago

Stable-SPAM: How to Train in 4-Bit More Stably than 16-Bit Adam

Paper • 2502.17055 • Published Feb 24 • 19

SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution

Paper • 2502.18449 • Published Feb 25 • 76

SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference

Paper • 2502.18137 • Published Feb 25 • 58

upvoted 3 papers 7 months ago

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

Paper • 2502.11089 • Published Feb 16 • 165

SelfCite: Self-Supervised Alignment for Context Attribution in Large Language Models

Paper • 2502.09604 • Published Feb 13 • 36

InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU

Paper • 2502.08910 • Published Feb 13 • 149

Florian Zimmermeister PRO

AI & ML interests

Recent Activity

Organizations

flozi00's activity

Open R1: Update #3

Open-source DeepResearch – Freeing our search agents