Disponible maintenant · Apache 2.0

flash-1-mini

L'IA juridique bilingue qui cite juste.

4 milliards de paramètres. Poids ouverts. Bilingue anglais et français. Elle s'exécute sur un portable — et une fois téléchargée, elle est à vous. Aucune clé API, aucun compte, rien que personne ne peut révoquer.

Télécharger sur Hugging Face Lire le lancement

Ce qu'elle fait

Une spécialiste, pas une généraliste

flash-1-mini est affinée pour les deux choses qui décident si une équipe juridique ou de conformité peut se fier à la sortie d'un modèle : citer juste, et suivre l'instruction exactement. Elle reste un modèle généraliste capable — mais c'est pour cela qu'elle est conçue.

Exactitude des citations juridiques

Produit des citations juridiques canadiennes correctement formatées 2,7× plus fiablement que la base dont elle est dérivée — 42,1 % contre 15,8 % sur le banc d'essai CBLRE.

Suivi des instructions

Suit les instructions détaillées en plusieurs parties avec 22,9 points de plus que la base sur IFEval — 53,2 % contre 30,3 %.

Bilingue et capable de vision

Fonctionne en anglais et en français avec une parité de confidentialité entre les deux, et lit les images — la vision est héritée intacte du modèle de base.

Les chiffres

Bancs d'essai vérifiés

Chaque chiffre est mesuré contre la base Qwen dont flash-1-mini est dérivée, dans des conditions identiques, avec le même évaluateur. Tout se reproduit à partir de la méthodologie publique de bancs d'essai et de la suite d'évaluation CBLRE.

Capacité	Base	flash-1-mini	Δ
Intégrité des citations juridiques (CBLRE)	15,8 %	42,1 %	+26,3 (2,7×)
Suivi des instructions (IFEval)	30,3 %	53,2 %	+22,9
Droit international (MMLU, anglais)	70,3 %	76,0 %	+5,8
Jurisprudence (MMLU, anglais)	79,6 %	81,5 %	+1,9
Raisonnement complexe (BBH)	68,6 %	79,0 %	+10,4
TruthfulQA MC2	48,8 %	50,8 %	+2,0
Connaissances générales (MMLU)	69,8 %	69,8 %	préservé
Parité de confidentialité bilingue (FR/EN, CBLRE)	—	1,00	parité

Compromis assumés

Une spécialiste cède du terrain qu'elle n'est pas conçue pour tenir. flash-1-mini sacrifie une partie de la performance en recherche documentaire et en usage d'outils pour les gains ci-dessus. Nous le publions ici, au même poids que les gains — pas enterré dans une note de bas de page.

Capacité	Base	flash-1-mini	Δ
Q&R ancrée sur documents (RAG canadien)	80,5 %	75,5 %	−5,0
Appel de fonctions (BFCL v4)	37,7 %	28,6 %	−9,1
Droit professionnel français (Global-MMLU FR)	49,0 %	44,6 %	−4,4
Droit civil québécois (CBLRE)	95,0 %	90,0 %	−5,0

Pour les charges lourdes en recherche documentaire (RAG) ou en usage d'outils, le modèle de base ou une autre spécialisation vous servira peut-être mieux. Nous préférons vous le dire que d'en faire trop.

Résultats du point de contrôle flash-1-mini-20260602.

Pour qui

Pour ceux qui ne peuvent pas se tromper de citation

Équipes juridiques et de conformité

Rédaction et recherche où une mauvaise citation est un vrai problème — en anglais ou en français.

Analystes des politiques et de la réglementation

Flux de travail réglementés canadiens couvrant la common law et le droit civil québécois.

Déploiements en périphérie et isolés du réseau

Fonctionne là où les API infonuagiques ne peuvent pas — du matériel de classe Raspberry Pi à un petit serveur, entièrement hors ligne.

Évaluateurs et chercheurs

Reproduisez chaque chiffre avec la méthodologie ouverte et la suite CBLRE. Vérifiez par vous-même.

Comment l'installer

Trois façons de l'exécuter

Poids ouverts — téléchargez le fichier et pointez votre runtime dessus. Aucun compte, aucune clé.

Python · transformers

from transformers import AutoProcessor, AutoModelForCausalLM
import torch

model = AutoModelForCausalLM.from_pretrained(
    "simpledirect/flash-1-mini",
    torch_dtype=torch.bfloat16,
    device_map="auto",
    trust_remote_code=True,
)
processor = AutoProcessor.from_pretrained("simpledirect/flash-1-mini")

Service en production · vLLM

vllm serve simpledirect/flash-1-mini \
  --dtype bfloat16 \
  --trust-remote-code \
  --max-model-len 8192

Portable et périphérie · llama.cpp / Ollama / LM Studio

# GGUF builds: simpledirect/flash-1-mini-gguf
ollama run hf.co/simpledirect/flash-1-mini-gguf:Q4_K_M

Quantifications GGUF : Q4_K_M, Q5_K_M, Q8_0. Utilisez Q4_K_M pour un portable et le matériel de classe Pi ; Q8_0 pour un ordinateur de bureau ou un serveur avec 16 Go+ de RAM.

Ouvert avec le modèle

Quatre biens publics

Nous publions l'infrastructure d'évaluation avec le modèle — les liens s'activent à mesure que chaque pièce arrive. C'est la norme qui compte.

Corpus juridique bilingue canadien

Le jeu de données sur lequel flash-1-mini est affinée, avec documentation de provenance.

Bientôt disponible

Suite d'évaluation CBLRE (préversion)

Évaluation juridique et réglementaire bilingue canadienne — six volets, vérité terrain bilingue, notation reproductible.

Bientôt disponible

Méthodologie d'évaluation de l'IA canadienne v1.0

Comment évaluer l'IA pour les flux de travail réglementés canadiens.

Bientôt disponible

Méthodologie de bancs d'essai des modèles v1.0

Comment nous avons mesuré ce que nous avons mesuré — le protocole de reproductibilité.

Bientôt disponible

Voir les quatre sur la page Méthodologie

Apache 2.0. Le fichier vous appartient.

flash-1-mini est publiée sous la licence Apache 2.0 — les poids fusionnés, l'adaptateur, le code et la documentation. C'est une œuvre dérivée d'un modèle de base Qwen ouvert, sous licence Apache 2.0, que nous attribuons comme la licence l'exige (voir le fichier NOTICE). Apache 2.0 signifie que l'usage commercial, la redistribution et la modification sont tous permis. Aucune limite sur le nombre d'employés. Rien à révoquer.

Licence Apache 2.0 · NOTICE et attributionBientôt disponible

Citez-la

@misc{simpledirect2026flash1mini,
  title        = {flash-1-mini: A Bilingual Canadian Legal AI},
  author       = {Naik, Ayush and Pu, George and Grover, Vikas},
  organization = {SimpleDirect / Alpine Pacific Trading Inc.},
  year         = {2026},
  url          = {https://huggingface.co/simpledirect/flash-1-mini}
}

Qui l'a construite

Une équipe de cinq personnes à Toronto

George Pu (fondateur), Vikas Grover (chef de l'exploitation et des finances) et Ayush Naik (ingénierie), avec une petite équipe de pigistes en ingénierie. Conçue à Toronto, au Canada.

Une question, ou une demande d'approvisionnement ? Nous contacter

L'IA qui vous appartient.

L'histoire complète derrière flash-1-mini — pourquoi un modèle juridique canadien bilingue, et ce que signifie réellement en posséder un — est sur Founder Reality.

Lire l'essai de lancement