Disponible maintenant · Apache 2.0
flash-1-mini
L'IA juridique bilingue qui cite juste.
4 milliards de paramètres. Poids ouverts. Bilingue anglais et français. Elle s'exécute sur un portable — et une fois téléchargée, elle est à vous. Aucune clé API, aucun compte, rien que personne ne peut révoquer.
Ce qu'elle fait
Une spécialiste, pas une généraliste
flash-1-mini est affinée pour les deux choses qui décident si une équipe juridique ou de conformité peut se fier à la sortie d'un modèle : citer juste, et suivre l'instruction exactement. Elle reste un modèle généraliste capable — mais c'est pour cela qu'elle est conçue.
Exactitude des citations juridiques
Produit des citations juridiques canadiennes correctement formatées 2,7× plus fiablement que la base dont elle est dérivée — 42,1 % contre 15,8 % sur le banc d'essai CBLRE.
Suivi des instructions
Suit les instructions détaillées en plusieurs parties avec 22,9 points de plus que la base sur IFEval — 53,2 % contre 30,3 %.
Bilingue et capable de vision
Fonctionne en anglais et en français avec une parité de confidentialité entre les deux, et lit les images — la vision est héritée intacte du modèle de base.
Les chiffres
Bancs d'essai vérifiés
Chaque chiffre est mesuré contre la base Qwen dont flash-1-mini est dérivée, dans des conditions identiques, avec le même évaluateur. Tout se reproduit à partir de la méthodologie publique de bancs d'essai et de la suite d'évaluation CBLRE.
| Capacité | Base | flash-1-mini | Δ |
|---|---|---|---|
| Intégrité des citations juridiques (CBLRE) | 15,8 % | 42,1 % | +26,3 (2,7×) |
| Suivi des instructions (IFEval) | 30,3 % | 53,2 % | +22,9 |
| Droit international (MMLU, anglais) | 70,3 % | 76,0 % | +5,8 |
| Jurisprudence (MMLU, anglais) | 79,6 % | 81,5 % | +1,9 |
| Raisonnement complexe (BBH) | 68,6 % | 79,0 % | +10,4 |
| TruthfulQA MC2 | 48,8 % | 50,8 % | +2,0 |
| Connaissances générales (MMLU) | 69,8 % | 69,8 % | préservé |
| Parité de confidentialité bilingue (FR/EN, CBLRE) | — | 1,00 | parité |
Compromis assumés
Une spécialiste cède du terrain qu'elle n'est pas conçue pour tenir. flash-1-mini sacrifie une partie de la performance en recherche documentaire et en usage d'outils pour les gains ci-dessus. Nous le publions ici, au même poids que les gains — pas enterré dans une note de bas de page.
| Capacité | Base | flash-1-mini | Δ |
|---|---|---|---|
| Q&R ancrée sur documents (RAG canadien) | 80,5 % | 75,5 % | −5,0 |
| Appel de fonctions (BFCL v4) | 37,7 % | 28,6 % | −9,1 |
| Droit professionnel français (Global-MMLU FR) | 49,0 % | 44,6 % | −4,4 |
| Droit civil québécois (CBLRE) | 95,0 % | 90,0 % | −5,0 |
Pour les charges lourdes en recherche documentaire (RAG) ou en usage d'outils, le modèle de base ou une autre spécialisation vous servira peut-être mieux. Nous préférons vous le dire que d'en faire trop.
Résultats du point de contrôle flash-1-mini-20260602.
Pour qui
Pour ceux qui ne peuvent pas se tromper de citation
Équipes juridiques et de conformité
Rédaction et recherche où une mauvaise citation est un vrai problème — en anglais ou en français.
Analystes des politiques et de la réglementation
Flux de travail réglementés canadiens couvrant la common law et le droit civil québécois.
Déploiements en périphérie et isolés du réseau
Fonctionne là où les API infonuagiques ne peuvent pas — du matériel de classe Raspberry Pi à un petit serveur, entièrement hors ligne.
Évaluateurs et chercheurs
Reproduisez chaque chiffre avec la méthodologie ouverte et la suite CBLRE. Vérifiez par vous-même.
Comment l'installer
Trois façons de l'exécuter
Poids ouverts — téléchargez le fichier et pointez votre runtime dessus. Aucun compte, aucune clé.
Python · transformers
from transformers import AutoProcessor, AutoModelForCausalLM
import torch
model = AutoModelForCausalLM.from_pretrained(
"simpledirect/flash-1-mini",
torch_dtype=torch.bfloat16,
device_map="auto",
trust_remote_code=True,
)
processor = AutoProcessor.from_pretrained("simpledirect/flash-1-mini")Service en production · vLLM
vllm serve simpledirect/flash-1-mini \
--dtype bfloat16 \
--trust-remote-code \
--max-model-len 8192Portable et périphérie · llama.cpp / Ollama / LM Studio
# GGUF builds: simpledirect/flash-1-mini-gguf
ollama run hf.co/simpledirect/flash-1-mini-gguf:Q4_K_MQuantifications GGUF : Q4_K_M, Q5_K_M, Q8_0. Utilisez Q4_K_M pour un portable et le matériel de classe Pi ; Q8_0 pour un ordinateur de bureau ou un serveur avec 16 Go+ de RAM.
Ouvert avec le modèle
Quatre biens publics
Nous publions l'infrastructure d'évaluation avec le modèle — les liens s'activent à mesure que chaque pièce arrive. C'est la norme qui compte.
Corpus juridique bilingue canadien
Le jeu de données sur lequel flash-1-mini est affinée, avec documentation de provenance.
Bientôt disponibleSuite d'évaluation CBLRE (préversion)
Évaluation juridique et réglementaire bilingue canadienne — six volets, vérité terrain bilingue, notation reproductible.
Bientôt disponibleMéthodologie d'évaluation de l'IA canadienne v1.0
Comment évaluer l'IA pour les flux de travail réglementés canadiens.
Bientôt disponibleMéthodologie de bancs d'essai des modèles v1.0
Comment nous avons mesuré ce que nous avons mesuré — le protocole de reproductibilité.
Bientôt disponibleApache 2.0. Le fichier vous appartient.
flash-1-mini est publiée sous la licence Apache 2.0 — les poids fusionnés, l'adaptateur, le code et la documentation. C'est une œuvre dérivée d'un modèle de base Qwen ouvert, sous licence Apache 2.0, que nous attribuons comme la licence l'exige (voir le fichier NOTICE). Apache 2.0 signifie que l'usage commercial, la redistribution et la modification sont tous permis. Aucune limite sur le nombre d'employés. Rien à révoquer.
Citez-la
@misc{simpledirect2026flash1mini,
title = {flash-1-mini: A Bilingual Canadian Legal AI},
author = {Naik, Ayush and Pu, George and Grover, Vikas},
organization = {SimpleDirect / Alpine Pacific Trading Inc.},
year = {2026},
url = {https://huggingface.co/simpledirect/flash-1-mini}
}Qui l'a construite
Une équipe de cinq personnes à Toronto
George Pu (fondateur), Vikas Grover (chef de l'exploitation et des finances) et Ayush Naik (ingénierie), avec une petite équipe de pigistes en ingénierie. Conçue à Toronto, au Canada.
Une question, ou une demande d'approvisionnement ? Nous contacter
L'IA qui vous appartient.
L'histoire complète derrière flash-1-mini — pourquoi un modèle juridique canadien bilingue, et ce que signifie réellement en posséder un — est sur Founder Reality.
Lire l'essai de lancement