Biens publics ouverts
Les quatre biens publics
Nous publions l'infrastructure d'évaluation en même temps que le modèle — ouvertement, pour que tout concepteur, évaluateur ou acheteur d'IA canadien puisse référencer, reproduire et vérifier la même base de référence. C'est la norme qui compte. Les liens s'activent à mesure que chaque artefact arrive.
Corpus juridique bilingue canadien
Le jeu de données ouvert sur lequel flash-1-mini est affinée, avec documentation complète de provenance. Bilingue anglais et français, contexte juridique canadien.
Bientôt disponibleSuite d'évaluation CBLRE
L'Évaluation juridique et réglementaire bilingue canadienne — six volets, vérité terrain bilingue, notation reproductible. En préversion, en attendant la validation par des experts.
Bientôt disponibleMéthodologie d'évaluation de l'IA canadienne
Comment évaluer l'IA pour les flux de travail réglementés canadiens — le cadre derrière les volets CBLRE.
Bientôt disponibleMéthodologie de bancs d'essai des modèles
Comment nous avons mesuré ce que nous avons mesuré — le protocole de reproductibilité qui rend chaque chiffre publié vérifiable.
Bientôt disponibleMaintenus, versionnés et mis à jour par l'équipe SimpleDirect. Citez-les dans vos appels d'offres et votre notation d'approvisionnement ; citez-les dans vos travaux universitaires.
Voir le modèle que ces normes ont mesuré
Aller à flash-1-mini