La dernière fois, nous vous avons dit ce qui avait changé et pourquoi. Cette fois, nous voulons vous présenter la chose elle-même.
vinci-studio sort le 8 août : un modèle capable, bâti sur une base ouverte solide, façonné par notre processus d'affinage constitutionnel et publié ouvertement sous licence Apache 2.0. C'est le premier d'une famille que nous appelons Vinci.
Voici ce que c'est, d'où vient le nom et — la partie qui nous tient le plus à cœur — comment vous pouvez vérifier qu'il fait ce que nous disons.
Le nom
Vinci, c'est pour Léonard, mais pas pour la raison que vous croiriez. Il ne s'agit pas de génie.
Il s'agit d'une habitude qu'il appelait saper vedere — « savoir voir ». L'idée que comprendre une chose, c'est la regarder de près et honnêtement, sous toutes ses faces, avant de décider de ce qui est vrai.
C'est la posture que nous voulons pour un modèle utilisé dans un travail sérieux. Pas une voix assurée qui sonne juste. Quelque chose qui regarde ce qui se trouve réellement devant lui, vous montre ce qu'il a trouvé et vous laisse voir la même chose que lui.
La famille grandit à partir de là — bozza, studio, tela, opera, magna, codice — chacun un outil différent pour un type de travail différent. studio vient en premier. Nous présenterons toute la gamme dans quelques semaines.
Ce que nous voulons vraiment que vous sachiez
Nous publions tout. La méthodologie. La constitution contre laquelle le modèle est entraîné. Le document de caractère. Les résultats des tests adverses issus des poids exacts que nous déployons.
Non pas parce que nous y sommes obligés. Parce que nous ne croyons pas que ce qui mérite votre confiance devrait être un secret.
Beaucoup d'entreprises d'IA vous demandent de faire confiance à une méthode que vous ne pouvez pas voir et à un modèle que vous ne pouvez pas inspecter. Nous faisons l'inverse. La recette est publique, la spécification est publique et les résultats des tests sont publics — de sorte qu'il ne nous reste plus à être jugés que sur une chose : Vinci se comporte-t-il réellement comme le dit notre constitution ?
C'est tout l'intérêt de la démarche. Pas « faites-nous confiance, nous avons une méthode astucieuse ». Plutôt : voici exactement ce que nous avons promis, voici comment le modèle s'est réellement comporté, comparez vous-même.
Si les deux ne concordent pas, vous le saurez avant même que nous disions un mot. C'est voulu.
Ce qui définit Vinci
Cinq choses, et chacune est quelque chose que vous pouvez vérifier plutôt que quelque chose que vous devez croire.
Capable. Il repose sur une base ouverte de calibre frontière, donc il est véritablement intelligent dès la première requête. Nous n'avons pas reconstruit le moteur — nous avons bâti tout le reste autour.
Caractère. Nous l'entraînons à partir d'une constitution écrite et d'un document de caractère. Les deux sont publics et les deux accompagnent les poids, pour que vous puissiez lire exactement ce que Vinci est censé faire et qui il est censé être avant même de le déployer.
Vérifiable. Nous publions de vrais résultats de tests adverses — HarmBench, JailbreakBench et un banc d'essai sur le comportement de censure des modèles chinois, exécutés contre le modèle que nous livrons réellement, pas une démo nettoyée. Ensuite, vous exécutez les vôtres.
Ancré. Il répond à partir de vos documents et les cite. Pas de source, pas d'affirmation. S'il ne peut pas indiquer d'où vient une réponse, il ne devrait pas vous la donner.
Souverain. Hébergé sur une infrastructure souveraine canadienne au Québec, sans aucune rétention de données par défaut. Vos données restent au pays et ne traînent pas.
La promesse derrière tout cela
Une spécification ne vaut quelque chose que si quelqu'un est tenu responsable lorsque la réalité s'en écarte. Voici donc la nôtre, clairement.
Si le comportement déployé de Vinci s'écarte un jour de ce qu'annonce l'ensemble de vérification, nous publions le diagnostic et le correctif dans les 30 jours.
Nous pouvons faire cette promesse parce que les poids et les tests sont ouverts — vous pouvez repérer l'écart vous-même, ce qui veut dire que nous ne pouvons pas discrètement faire comme si de rien n'était. Les fournisseurs fermés ne peuvent pas offrir la même chose, parce que leurs clients n'ont aucun moyen de confirmer l'écart au départ.
Nous préférons être tenus à une promesse que vous pouvez vérifier plutôt qu'à une que vous devez croire sur parole.
Ce que nous ne prétendons pas
L'honnêteté va dans les deux sens, alors voici deux ou trois choses que nous voulons dire franchement.
Toute cette approche n'est aussi solide que les tests sont exigeants. Si nos tests adverses étaient faibles ou si nous corrigions notre propre copie, « vérifiable » ne serait qu'une forme de marketing au nom plus joli. Nous concevons donc les tests pour qu'ils soient réellement adverses et exécutables par quiconque — et nous préférons que vous les mettiez à l'épreuve plutôt que de leur faire confiance.
Et comme nous l'avons dit la dernière fois, le travail dédié au français juridique québécois attend pour l'instant. Vinci est solide en français en tant que modèle multilingue capable, et les sources françaises vivent dans la bibliothèque qu'il consulte — mais le registre juridique québécois soigné viendra plus tard, pas au lancement.
Et ensuite
La semaine prochaine, nous expliquons comment l'affinage constitutionnel fonctionne réellement, en langage clair — la partie que tout le monde croit secrète, détaillée pour que vous puissiez l'utiliser vous-même.
Ensuite : la publication ouverte de notre corpus juridique et de nos évaluations, la réflexion derrière la promesse de 30 jours, la famille Vinci au complet et le caractère de Vinci — pour aboutir le jour du lancement.
Un nouveau billet chaque mardi à 9 h (HE). Le prochain, le 7 juillet.
vinci-studio sort le 8 août. Quand ce sera fait : lisez la constitution, dupliquez les poids, exécutez les tests. Voyez s'il fait ce que nous avons dit.
À bientôt, L'équipe SimpleDirect
Pour aller plus loin