Aujourd'hui, nous publions flash-1-mini — le premier modèle de notre famille à poids ouverts, bilingue et de contexte canadien. Vous pouvez le télécharger, l'exécuter sur un portable et le garder. Aucune clé API, aucun compte, rien que personne ne peut révoquer.
C'est un modèle de 4 milliards de paramètres, capable de vision, publié sous licence Apache 2.0 et affiné pour une tâche en particulier : citer juste le droit canadien.
Une spécialiste, pas une généraliste
La plupart des modèles sont notés sur ce qu'ils savent. flash-1-mini est notée sur quelque chose de plus précis et de plus utile à une équipe juridique ou de conformité : peut-on se fier à ce qu'elle écrit ? Cela se résume à deux choses — citer juste, et suivre l'instruction exactement.
Nous l'avons affinée à partir d'une base Qwen ouverte, sous licence Apache 2.0, sur un corpus bilingue de droit canadien, puis mesurée contre cette base exacte dans des conditions identiques, avec le même évaluateur. Elle reste un modèle généraliste capable — mais c'est pour cela qu'elle est conçue.
Comment elle se mesure
Contre le modèle de base dont elle est dérivée, dans des conditions identiques :
| Capacité | Base | flash-1-mini | Δ |
|---|---|---|---|
| Intégrité des citations juridiques (CBLRE) | 15,8 % | 42,1 % | +26,3 (2,7×) |
| Suivi des instructions (IFEval) | 30,3 % | 53,2 % | +22,9 |
| Raisonnement complexe (BBH) | 68,6 % | 79,0 % | +10,4 |
| Connaissances générales (MMLU) | 69,8 % | 69,8 % | préservé |
Vérifié · reproductible à partir de la méthodologie publique
Une spécialiste sacrifie ce pour quoi elle n'est pas conçue. flash-1-mini cède du terrain en recherche documentaire (RAG canadien, −5,0) et en usage d'outils (appel de fonctions, −9,1). Nous publions ces régressions à côté des gains — le tableau complet, chaque chiffre, se trouve sur la page du modèle.
Ouvert dès le premier jour
Les poids du modèle sont disponibles dès aujourd'hui sur Hugging Face. Avec eux, nous publions quatre biens publics ouverts — le Corpus juridique bilingue canadien, la suite d'évaluation CBLRE et deux normes de méthodologie — déployés dans les jours qui suivent.
Le but, c'est la reproductibilité : chaque chiffre que nous publions peut être reproduit à partir de la méthodologie et de la suite d'évaluation publiques. La norme est ouverte, pour que tout concepteur, évaluateur ou responsable des achats puisse nous y tenir — et y tenir n'importe quel autre modèle.
À vous de la garder
flash-1-mini fonctionne sur du matériel grand public, des portables Apple Silicon aux appareils de classe Raspberry Pi, entièrement hors ligne. Une fois téléchargée, c'est un fichier sur votre machine. Si SimpleDirect disparaissait demain, elle fonctionnerait toujours.
C'est tout le principe : l'IA qui vous appartient.
SimpleDirect®, exploitée sous Alpine Pacific Trading Inc., est une équipe basée à Toronto qui construit des modèles d'IA à poids ouverts, bilingues et de contexte canadien, que vous pouvez télécharger, exécuter et posséder.