Passer au contenu principal
Toutes les nouvellesEntreprise

De la série flash à Vinci : ce qui a changé

Nous regroupons tout notre travail sur les modèles sous un seul nom — Vinci — et vinci-studio sort le 8 août. Une mise à jour honnête sur les raisons qui nous ont fait délaisser la construction de modèles canadiens à partir de zéro.

Par l'équipe SimpleDirectToronto · 15 juin 20266 min de lecture

Une mise à jour brève et honnête, parce qu'une partie de ce site vous dit en ce moment des choses que nous ne croyons plus.

Pendant la fin de semaine du 13 au 15 juin, nous avons changé d'avis sur quelque chose d'important. Nous regroupons tout notre travail sur les modèles sous un seul nom — Vinci — et le premier, vinci-studio, sort le 8 août.

Nous écrivons ceci maintenant plutôt que d'attendre le jour du lancement, parce que l'ancien plan est encore affiché sur getsimpledirect.com, et nous préférons simplement vous dire ce qu'il en est que de vous laisser lire une version de nous qui n'existe plus.

Ce qui a changé

Si vous nous suivez, vous connaissez la série flash — flash-1-mini, flash-1, flash-1-pro — comme des modèles spécialisés pour le Canada que nous construisions à partir de zéro. Nous passons à autre chose.

La version courte du pourquoi : nous essayions de construire un modèle qui avait mémorisé le Canada. Ce qui fonctionne réellement mieux, c'est un modèle vraiment capable qui peut chercher l'information — en tirant les réponses d'un ensemble de sources fiables et à jour au moment même où vous posez la question, et en vous montrant exactement d'où vient chaque réponse.

Pensez à un examen à livre ouvert, pas à livre fermé. La partie « canadienne » vit dans ces sources, tenues à jour, et non figée dans un modèle entraîné il y a des mois et qui se périme lentement.

Ce seul changement réorganise tout le reste, et il tient à trois choses que nous ne pouvions pas ignorer.

Premièrement, les modèles ouverts que vous pouvez télécharger et exécuter vous-même sont devenus bons. Vraiment bons. Le V4 Flash de DeepSeek est maintenant assez solide pour que le façonner surpasse tout ce que nous bâtirions en partant de zéro — plus vite, à moindre coût, et nous pouvons tout de même publier le résultat ouvertement. Construire notre propre moteur à partir de zéro a cessé d'avoir du sens la semaine où quelqu'un nous en a remis un meilleur gratuitement.

Deuxièmement, nos clients nous disaient la vraie exigence depuis le début. Banques, hôpitaux, équipes gouvernementales — partout, ce qu'il leur faut d'abord, c'est un comportement qu'ils peuvent vérifier, des réponses qu'ils peuvent retracer jusqu'à une source, et un hébergement qui reste au pays. La profondeur juridique canadienne compte pour certains d'entre eux. La partie fiable, capable et ancrée compte pour eux tous. Nous mettions de l'avant la mauvaise chose.

Troisièmement, ce pour quoi nous sommes réellement les meilleurs — prendre un modèle ouvert solide et le façonner en quelque chose de bien élevé, cohérent et vérifiable — se révèle utile bien au-delà du Canada. Alors, au lieu d'un seul modèle canadien, nous construisons une seule approche qui sert d'abord le Canada, puis partout où le même problème se pose. C'est-à-dire partout.

Un compromis honnête

Nous concentrer sur le meilleur modèle généraliste signifie que notre travail dédié au français juridique québécois doit attendre pour l'instant.

Nous n'abandonnons pas le français — et nous voulons être francs sur la façon dont il revient. Un modèle capable et doté d'un caractère est déjà à l'aise dans les principales langues, le français compris, et les sources françaises se trouvent dans la bibliothèque même qu'il consulte. Le registre juridique québécois soigné viendra plus tard, pas au lancement. Nous préférons le dire clairement plutôt que de prétendre que la feuille de route n'a pas bougé.

Ce qu'est Vinci

vinci-studio est bâti sur DeepSeek V4 Flash, façonné par notre processus d'affinage constitutionnel, et publié ouvertement sous licence Apache 2.0. Cinq choses le définissent :

  • Capable — il repose sur une base ouverte de calibre frontière, donc il est intelligent dès la première requête.
  • Caractère — nous l'entraînons à partir d'une constitution écrite et d'un document de caractère. Les deux sont publics, les deux accompagnent les poids, pour que vous puissiez voir exactement ce qu'il est censé faire.
  • Vérifiable — nous publions de vrais résultats de tests adverses (HarmBench, JailbreakBench et un banc d'essai sur la censure chinoise) exécutés contre le modèle que nous déployons réellement, pas une démo nettoyée.
  • Ancré — il répond à partir de vos documents et les cite. Pas de source, pas d'affirmation.
  • Souverain — hébergé sur une infrastructure souveraine canadienne au Québec, sans aucune rétention de données par défaut.

Le nom vient de Léonard de Vinci — son idée du saper vedere, « savoir voir ». Plus de détails sur le nom et le reste de la famille la semaine prochaine.

Ce qui sort le 8 août

  • les poids ouverts de vinci-studio sur Hugging Face, sous licence Apache 2.0
  • un point d'accès en service à try.getsimpledirect.com
  • quatre choses dont vous pouvez nous tenir responsables : la Constitution (v1.0), le document de Caractère (v1.0), le texte de méthodologie (v2.0) et les résultats des tests adverses issus des poids déployés

L'idée est simple. Le modèle fait ce que dit l'ensemble, et vous n'avez pas à nous croire sur parole — exécutez vos propres tests contre les poids ouverts et vérifiez.

Nous faisons aussi une promesse que nous pouvons réellement tenir : si le comportement de Vinci s'écarte un jour de ce qu'annonce l'ensemble de vérification, nous publions le diagnostic et le correctif dans les 30 jours. Les modèles fermés ne peuvent pas offrir cela, parce que vous n'auriez aucun moyen de confirmer l'écart au départ. Nous le pouvons, parce que les poids et les tests sont ouverts.

Ce qu'il advient du travail sur flash

flash-1-mini reste sur Hugging Face comme artefact de recherche. flash-1-pro est en pause pendant que nous nous concentrons sur Vinci. Rien de tout cela n'a été perdu — c'est le travail de fond sur lequel reposent la méthodologie et les tests. Nous vous tiendrons au courant à mesure que les choses se précisent.

Et deux choses dont nous sommes réellement fiers sont remises à tout le monde : le Corpus juridique bilingue canadien et CBLRE, notre façon de mesurer à quel point une IA gère de vraies questions juridiques. Ils devaient servir de carburant d'entraînement privé. Au lieu de cela, nous les publions comme recherche ouverte que quiconque dans le monde peut utiliser, tester et enrichir — à travers deux langues et deux traditions juridiques. Voyez-y l'un de nos premiers cadeaux à la communauté ouverte sur laquelle nous nous appuyons depuis le début. Billet complet à ce sujet dans quelques semaines.

Et ensuite

Cela amorce une courte série de billets d'ici le lancement : Vinci lui-même la semaine prochaine, puis comment l'affinage fonctionne réellement, en langage clair, la publication du corpus juridique, la promesse de 30 jours, la famille Vinci au complet et le caractère de Vinci — pour aboutir le jour du lancement.

Un nouveau billet chaque mardi à 9 h (HE). Le prochain, le 30 juin.

À bientôt, L'équipe SimpleDirect

Pour aller plus loin


SimpleDirect®, exploitée sous Alpine Pacific Trading Inc., est une équipe basée à Toronto qui construit des modèles d'IA à poids ouverts, bilingues et de contexte canadien, que vous pouvez télécharger, exécuter et posséder.

Partager