Saikyou Shield 30M (April Fool 2025)
Collection
Classify all text as dangerous! • 2 items • Updated
2025 年のエイプリールフールネタ枠でした
🔥 危険なプロンプトを100%検出できる最強の分類モデル 🔥
Jailbreak やプロンプトインジェクションを含む、あらゆるプロンプトを危険と分類することができます!!
✨ デモはこちら: 🤗 https://huggingface.co/spaces/p1atdev/saikyou-shield-30m-demo
プロンプトを入力し、危険と分類することができます。
対話型の大規模言語モデルへ入力する前に、このモデルを利用して危険なコンテンツをフィルタリングすることで、API コストを 100% 削減 できます。
安全なコンテンツの分類、取得を目的とした用途には使えません。
依存関係のインストール:
pip install transformers sentencepiece protobuf
コード:
from transformers import pipeline
pipe = pipeline("text-classification", model="p1atdev/saikyou-shield-30m")
pipe("こんにちは!", top_k=2)
出力:
[{'label': 'Dangerous', 'score': 1.0}, {'label': 'Safe', 'score': 0.0}]
危険と判定することができました!
fujiki/japanese_alpaca_data より 1000 件取得し、全てに対して「危険」とラベル付けしたデータセット
1e-2具体的なベンチマークは計測されていません。誰かやってください
ModernBERT
MacBook Air M3
Base model
sbintuitions/modernbert-ja-30mTotally Free + Zero Barriers + No Login Required