lmms-lab
/

LLaVA-OneVision-1.5-8B-Instruct

Image-Text-to-Text

feature-extraction

Model card Files Files and versions

Yin-Xie commited on 7 days ago

Commit

8eb300d

·

verified ·

1 Parent(s): 193cd55

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -17,7 +17,7 @@ base_model:
 A family of fully open-source large multimodal models demonstrating **superior performance** across multiple multimodal benchmarks, **outperforming Qwen2.5-VL** in most evaluation tasks.
 2. **High-Quality Data at Scale**
-Meticulously curated **mid-training and SFT data** with rigorous filtering and quality control, achieving **superior data efficiency** with only **5B tokens** (1.2% of Qwen2.5-VL's training data).
 - Concept-balanced, highly diverse, high-quality caption data
 - Comprehensive instruction fine-tuning data covering a wide range of tasks

 A family of fully open-source large multimodal models demonstrating **superior performance** across multiple multimodal benchmarks, **outperforming Qwen2.5-VL** in most evaluation tasks.
 2. **High-Quality Data at Scale**
+Meticulously curated **mid-training and SFT data** with rigorous filtering and quality control.
 - Concept-balanced, highly diverse, high-quality caption data
 - Comprehensive instruction fine-tuning data covering a wide range of tasks