Passer au contenu principal

Biens publics ouverts

Les quatre biens publics

Nous publions l'infrastructure d'évaluation en même temps que le modèle — ouvertement, pour que tout concepteur, évaluateur ou acheteur d'IA canadien puisse référencer, reproduire et vérifier la même base de référence. C'est la norme qui compte. Les liens s'activent à mesure que chaque artefact arrive.

Jeu de données

Corpus juridique bilingue canadien

Le jeu de données ouvert sur lequel flash-1-mini est affinée, avec documentation complète de provenance. Bilingue anglais et français, contexte juridique canadien.

Bientôt disponible
Suite d'évaluation · Préversion

Suite d'évaluation CBLRE

L'Évaluation juridique et réglementaire bilingue canadienne — six volets, vérité terrain bilingue, notation reproductible. En préversion, en attendant la validation par des experts.

Bientôt disponible
Méthodologie · v1.0

Méthodologie d'évaluation de l'IA canadienne

Comment évaluer l'IA pour les flux de travail réglementés canadiens — le cadre derrière les volets CBLRE.

Bientôt disponible
Méthodologie · v1.0

Méthodologie de bancs d'essai des modèles

Comment nous avons mesuré ce que nous avons mesuré — le protocole de reproductibilité qui rend chaque chiffre publié vérifiable.

Bientôt disponible

Maintenus, versionnés et mis à jour par l'équipe SimpleDirect. Citez-les dans vos appels d'offres et votre notation d'approvisionnement ; citez-les dans vos travaux universitaires.

Voir le modèle que ces normes ont mesuré

Aller à flash-1-mini