datasets: - ILSVRC/imagenet-1k base_model: - rupeshs/LCM-runwayml-stable-diffusion-v1-5 pipeline_tag: text-to-image tags: - stable-diffusion-1-5 - imagenet - blip
[SD 1.5 - ImageNet-BLIP-Finetune]
这是一个在 ImageNet 数据集上微调的 Stable Diffusion 1.5 模型。
与常规微调不同的是,本模型的训练没有使用 ImageNet 原始的单一类别标签(例如 "tench" 或 "goldfish")。相反,我们使用 BLIP 模型为 ImageNet 数据库中的每张图片生成了描述性的文本提示(Prompt)。
这种方法使得模型能够学习图像与更丰富、更具上下文的文本描述之间的联系,而不仅仅是学习僵硬的类别名称。
🚀 如何使用 (How to Use)
你可以像使用其他 diffusers 库中的 Stable Diffusion pipeline 一样使用这个模型。
首先,确保你安装了必要的库:
pip install diffusers transformers torch
- Downloads last month
- -
Model tree for kaimoonstar/SD1.5_imageNet
Base model
rupeshs/LCM-runwayml-stable-diffusion-v1-5