flash-1-mini
IA personnelle, mobile, périphérie, première IA privée
Gratuit — pour toujours
Niveau 1 (portable)
Spécifications
- Paramètres
- 4 milliards
- Longueur de contexte
- 8K jetons
- Quantification recommandée
- Q4_K_M (~2,7 Go)
- Matériel minimum
- Tout portable avec 4+ Go de RAM
- Licence
- Poids ouverts, aucune limite sur le nombre d'employés
Capacités
- Bilingue anglais / français
- Réponses avec citations sourcées
- Appel de fonctions
- Optimisé RAG
- Plusieurs niveaux de quantification GGUF
- Optimisé pour les appareils à faible mémoire
- Réponse sub-seconde sur Apple Silicon
- Quantifications de Q2_K à fp16
Compatibilité
- Ollama
- LM Studio
- llama.cpp
- Tout runtime conforme GGUF