Entretien avec Lillian Freiberg et Austin Ritzel
L'IA évolue à un rythme que la plupart des entreprises financières ont du mal à suivre. Cette discussion aborde ce que cela implique concrètement : pour la sécurité, la stratégie vis-à-vis des fournisseurs, et les collaborateurs de votre organisation qui s'y familiarisent discrètement, à votre insu.
1re partie : Le moment « Mythos » — Quand un modèle était trop dangereux pour être commercialisé
Lillian Freiberg : Bonjour à tous. Bienvenue. Je m’appelle Lillian Freiberg. Je suis directrice de la division Amérique du Nord chez Clarity AI. Je suis accompagnée de mon collègue Austin Ritzel, notre responsable senior de la stratégie IA et des projets stratégiques. En gros, c’est la personne que je vais importuner quand quelque chose va de travers dans le monde de l’IA et que j’ai besoin de comprendre comment cela va nous affecter, mes clients et moi-même.
Nous allons aborder de nombreux sujets. À quel rythme cette technologie évolue réellement. Ce que cela implique pour les entreprises qui tentent de suivre le rythme, et les décisions stratégiques qui feront la différence entre les gagnants et ceux qui sont encore en train de démêler les choix qu’ils ont faits il y a deux ans.
Austin Ritzel : Merci, Lillian. Je ne pourrais pas faire mieux que cette introduction. Tu m’as bien mis en situation. Je sais que nous avons beaucoup de choses à aborder aujourd’hui. Les sujets passionnants ne manquent pas actuellement dans le monde de l’IA.
Lillian Freiberg : Commençons par un sujet qui a vraiment secoué les esprits il y a quelques mois. Et si vous n’êtes pas au courant, je vais vous en faire un bref résumé.
Anthropic — l'équipe à l'origine de Claude, l'un des principaux laboratoires d'IA — a lancé un modèle baptisé Mythos. Les lancements d'IA sont monnaie courante. Mais celui-ci a eu un impact tout à fait différent. Mythos a été conçu pour exceller dans le domaine du codage. Ce que personne n'avait vraiment prévu, c'est que les mêmes capacités qui le rendaient si performant pour écrire du code en faisaient également, en substance, le scanner de failles de sécurité le plus puissant jamais vu. Près de 200 bogues graves ont été découverts rien que dans Firefox. À titre de comparaison, le modèle précédent en avait détecté une vingtaine, deux mois plus tôt seulement.
Voici ce qui a vraiment retenu l’attention du public. Anthropic a volontairement choisi de ne pas la rendre publique. L'entreprise a donné accès à environ 40 institutions — grandes sociétés financières, entreprises technologiques, infrastructures critiques — afin que les défenseurs puissent se préparer avant que cette capacité ne soit diffusée à grande échelle. Une telle retenue volontaire à une telle échelle n'avait jamais vraiment eu lieu auparavant. Cela a déclenché l'alerte à Washington et à Bruxelles, et a forcé un véritable débat sur l'état actuel de la course à l'IA.
À première vue, je dirais que nous sommes loin d'avoir tranché. Et toi, qu'en penses-tu ?
« Pour les acteurs honnêtes, c’est un bouclier très solide. Pour les acteurs malveillants, Mythos est une arme offensive très puissante. »
Austin Ritzel : Dans un domaine où l'on semble vivre des moments décisifs, voire sans précédent, toutes les deux semaines, celui-ci a véritablement marqué un tournant pour le secteur de l'IA. Et cela s'explique par plusieurs raisons.
Tout d'abord, comme vous l'avez mentionné, Mythos se distingue par sa capacité exceptionnelle à identifier les failles de sécurité, ce qui soulève bien sûr des questions liées au double usage. D'un côté, pour les acteurs bien intentionnés, il s'agit d'un bouclier très solide . Mais pour les acteurs malveillants, Mythos est une arme offensive très puissante — une épée, pour reprendre la métaphore.
La deuxième raison pour laquelle cela a eu un impact considérable tient à cette idée que vous avez évoquée : les modèles se développent, ils ne se construisent pas. C'est une façon totalement différente d'envisager la technologie. Ce n'est pas une idée que j'ai inventée. En fait, c'est ainsi que Dario Amodei, le PDG d'Anthropic, décrit le processus de création d'un modèle. Mythos n'a pas été optimisé spécifiquement pour l'analyse de cybersécurité. Il a été optimisé pour le codage, comme le sont de nombreux grands modèles linguistiques. Mais les mêmes capacités, les mêmes fonctionnalités qui le rendaient vraiment excellent en codage l'ont également rendu extrêmement efficace dans la détection de vulnérabilités.
« Mythos marque un véritable tournant par rapport à ce qu’Opus 4.6 était capable de faire en matière de détection des failles de sécurité. C’est un changement radical. »
Au début, certains ont affirmé qu’il s’agissait là du plus grand coup de pub de tous les temps — un modèle trop performant pour être commercialisé. Mais nous avons très vite compris qu’il ne s’agissait en réalité pas d’un simple coup de pub. Il s’agit d’un véritable bond en avant par rapport à ce que le modèle précédent, Opus 4.6, était capable de faire en matière de détection des failles de sécurité. Un changement radical.
Soit dit en passant, je tiens à souligner que cette notion de transférabilité des capacités d'un domaine à un autre est un phénomène que l'on observe dans le secteur financier. Bon nombre des éléments qui font que les grands modèles linguistiques excellent dans le codage, comme la logique, leur permettent également d'exceller dans de nombreuses tâches financières.
La troisième raison pour laquelle cette affaire a pris une telle ampleur : Anthropic a, de son propre chef, décidé de ne pas le rendre public et l'a mis à la disposition de ces 40 institutions — je crois qu'elles sont désormais 70 — afin de leur permettre de renforcer leurs défenses. Cela s'explique aussi en partie par certaines préoccupations liées à la puissance de calcul. Mythos est un modèle de très grande envergure.
« L'administration Trump a évoqué l'idée d'obliger les laboratoires spécialisés dans l'IA à soumettre leurs modèles aux autorités fédérales avant leur diffusion publique. Un peu comme une FDA dédiée au domaine de l'IA. »
Cela a suscité une réaction très intéressante de la part de l'administration Trump. Sur le plan idéologique, celle-ci s'est toujours opposée à la réglementation, en particulier dans le domaine de l'IA : l'un de ses premiers décrets présidentiels visait justement à abroger une réglementation mise en place par l'administration Biden. Or, elle avance désormais l'idée d'un décret présidentiel visant à obliger les laboratoires d'IA à soumettre leurs modèles aux autorités fédérales avant leur diffusion publique. Ce projet a été décrit comme une sorte de « FDA » du secteur de l'IA. Il s'agit là d'un changement majeur dans le paysage réglementaire.
Cela a également suscité une réaction de l'UE, car celle-ci s'est retrouvée laissée pour compte : aucune institution établie dans l'UE n'y avait accès non plus. Des questions se posent également quant à la garantie d'un accès libre et équitable pour tous les gouvernements afin de renforcer leurs défenses.
Cela dit, pour répondre à la première partie de votre question : la course à l'IA est-elle loin d'être jouée ? Absolument. Les experts s'accordent généralement à dire — et cela vient des PDG de ces entreprises — que les laboratoires américains n'ont aujourd'hui qu'un écart de 1 à 3 mois les uns par rapport aux autres. Les laboratoires chinois comme DeepSeek ont environ 6 à 12 mois de retard. Ils sont très, très proches les uns des autres. Et je pense que nous devons donc nous attendre à voir le secteur en constante évolution et réorganisation.
2e partie : Pourquoi le secteur des services financiers est au cœur de la crise
Lillian Freiberg : Intéressant. Donc, même si Anthropic vit actuellement son heure de gloire, rien n’est encore joué. La course est toujours d’actualité. Et comme vous l’avez souligné tout à l’heure, c’est dans le secteur des services financiers que cette course se joue de la manière la plus visible . Tous les grands fournisseurs d’IA se lancent à fond dans ce secteur. Diriez-vous qu’il s’agit d’un phénomène structurel, ou est-ce simplement là que se trouve l’argent ?
Austin Ritzel : Je pense que les deux. D'un point de vue structurel, bon nombre des caractéristiques qui rendent les grands modèles linguistiques particulièrement performants en programmation les rendent également très efficaces pour les processus financiers, ou du moins pour bon nombre d'entre eux, mais certainement pas tous. Anthropic estime que la finance a environ 6 à 12 mois de retard par rapport au codage sur la courbe d'automatisation. Et quiconque s'intéresse un tant soit peu au domaine de l'IA sait ce qui se passe actuellement en matière de codage.
C'est aussi, sans aucun doute, là où se trouve l'argent. Les grands laboratoires génèrent d'importants revenus dans le secteur financier. Pour Anthropic — et je les cite car ils viennent de publier une multitude de données à ce sujet —, en termes de chiffre d'affaires, le secteur financier occupe la deuxième place parmi tous les secteurs. Il n'est devancé que par le secteur technologique, et 40 % de leurs 50 principaux clients sont des institutions financières.
Lillian Freiberg : C'est tout à fait logique. Mais un retard de six à douze mois par rapport au développement informatique… J'ai l'impression que c'est en réalité plus proche de la réalité que la plupart des gens ne le pensent. Et pourtant, le secteur des services financiers est réputé pour être très lent à évoluer. Les cycles d'approvisionnement, les validations des risques, les autorisations de conformité. Le rythme du développement de l'IA est-il un casse-tête temporaire pour le secteur, ou y a-t-il ici un décalage plus profond ?
« Les grands laboratoires génèrent d'importants revenus dans le secteur financier. En termes de chiffre d'affaires, le secteur financier occupe la deuxième place parmi tous les secteurs d'activité pour Anthropic. »
Austin Ritzel : Je pense qu'il faut repartir des principes fondamentaux. D'où viennent ces frictions ? Il semble y avoir à la fois des frictions d'ordre procédural et structurel.
Les frictions procédurales — cycles de documentation, intégration des fournisseurs, ce genre de choses — pourraient probablement être considérablement réduites grâce à l’IA. Les frictions structurelles sont sans doute plus tenaces. Et par « frictions structurelles », j’entends la réglementation, l’obligation fiduciaire et la responsabilité personnelle quant aux décisions prises dans des domaines hautement réglementés. Dans le monde de la finance, il vaut sans doute mieux les considérer comme des atouts plutôt que comme des failles, d’autant plus que ce secteur est confronté au défi de l’IA, où le coût d’une erreur est très élevé.
La contrainte structurelle potentiellement la plus difficile à surmonter est un concept dont j’ai déjà parlé, que j’ai baptisé le « Silicon Ceiling » : la limite de la capacité d’une entreprise à intégrer de nouvelles compétences. Il s’agit notamment de la gestion du changement, de la réduction des déficits de compétences chez les employés et de la formation du personnel. Il existe un décalage entre la vitesse à laquelle les capacités de pointe évoluent et la vitesse à laquelle l’organisation est capable de les absorber. Et ce phénomène n’est pas propre aux institutions financières. L’enquête « 2026 State of AI in the Enterprise » menée par Deloitte a révélé que le déficit de compétences en IA est perçu comme le principal obstacle à l’intégration de l’IA dans les entreprises. Cet aspect plus flou de la barrière structurelle est donc d’une importance capitale pour comprendre à quelle vitesse toutes les entreprises peuvent évoluer.
Je m'attends à ce que cet écart se creuse probablement avant de se réduire. Mais on verra apparaître une divergence entre les entreprises qui investissent dans leur capacité d'absorption — ce qui revient en réalité à investir dans les ressources humaines et les processus en tant qu'actifs stratégiques — et celles qui ne le font pas. Je pense que les premières prendront le large.
« La contrainte structurelle potentiellement la plus difficile à surmonter est ce qu’on appelle le « plafond de silicium » : la limite de la capacité d’une entreprise à intégrer de nouvelles compétences. Il s’agit notamment de la gestion du changement, de la réduction des déficits de compétences chez les employés et de la formation du personnel. Il existe un décalage entre la vitesse à laquelle les nouvelles compétences de pointe apparaissent et la vitesse à laquelle l’organisation est capable de les intégrer. »
Lillian Freiberg : J’apprécie cette approche nuancée. Et le concept de « Silicon Ceiling » est particulièrement pertinent, car ce n’est pas nécessairement la technologie qui pose problème. Ce sont les personnes, l’organisation, l’intégration. Et cela nous amène directement à un sujet que je tiens à aborder avant de passer à autre chose, car il est très important et on me pose sans cesse cette question. Il s’agit de la cybersécurité. Mythos l’a rendu très concret. Lorsque les modèles sont déployés plus rapidement, qu’advient-il réellement de la surface d’exposition aux menaces pour une institution financière ?
Austin Ritzel : C'est une question vraiment importante, qui présente en fait la lenteur des institutions financières sous un jour très positif. Au lieu d'y voir de la lenteur, on y voit plutôt de la réflexion.
La rapidité de déploiement des modèles modifie la surface d'exposition aux menaces par le biais de deux vecteurs principaux. Le premier réside dans l'asymétrie entre les capacités offensives et défensives. Le cycle qui va de l'émergence d'une capacité à son apparition sur le terrain, puis à sa diffusion à grande échelle, se raccourcit. Et lorsque ce délai se réduit, cela ne se limite pas à laisser moins de temps aux défenseurs pour combler les failles. Cela leur laisse également moins de temps pour comprendre ce contre quoi ils se protègent. La décision d'Anthropic de retarder Mythos est le meilleur exemple que nous ayons eu jusqu'à présent d'une entreprise qui met le frein, qui tente de séparer la capacité du déploiement et qui offre à tout le monde un peu de temps pour se préparer.
Le deuxième aspect réside dans le fait que les périmètres de sécurité traditionnels évoluent, notamment à mesure que l’IA acquiert une capacité d’action, c’est-à-dire qu’elle commence réellement à accomplir des tâches. Une IA dotée de capacités d’action représente un enjeu très différent de celui d’un cerveau dans un bocal. Chaque intégration d'IA implique le déploiement d'un nouveau périmètre. Un agent ayant accès au calendrier, à la messagerie électronique, au système de fichiers… Cela ne s'inscrit pas clairement dans les modèles de privilèges minimaux sur lesquels nous nous sommes appuyés. Les pratiques de sécurité devront probablement évoluer en profondeur pour refléter ce rythme de changement. Plutôt que de mettre à jour la posture de sécurité une fois par an, il faudra adopter un rythme beaucoup plus mensuel afin d'essayer de suivre le rythme du développement de l'IA.
« Les périmètres de sécurité traditionnels sont en train d'évoluer, notamment à mesure que l'IA acquiert une capacité d'action et commence réellement à accomplir des tâches. Une IA dotée de mains représente un défi bien différent de celui d'un cerveau dans un bocal. »
3e partie : Une mauvaise décision prise au mauvais niveau
Lillian Freiberg : Cela va représenter un énorme changement pour certaines entreprises. Changeons donc un peu de sujet et parlons d'un problème avec lequel, je pense, beaucoup de gens vivent en silence en ce moment.
Imaginons : il y a 18 mois, votre entreprise a suivi tout le processus : audit informatique, validation des risques, accord des services de conformité, et a approuvé un modèle de base. Des ressources y ont été consacrées. Mais aujourd’hui, le contexte a changé et vous vous demandez : avons-nous misé sur le bon cheval ?
Ce qui a en grande partie aggravé la situation, c’est que bon nombre de ces décisions ont été prises au mauvais niveau. Les services chargés de la gestion des risques ou de l’informatique ont donné leur accord avant que les équipes opérationnelles ne comprennent vraiment ce qu’elles achetaient, comment elles allaient l’utiliser, voire qui allait s’en servir. À présent, on se retrouve avec un contrat, des processus de travail qui s’appuient dessus, et le reste du monde a déjà évolué.
Austin, est-ce que ça peut s'arranger ? Ou est-ce que le secteur va devoir continuer à assumer ces décisions prises à l'origine pendant encore un certain temps ?
Austin Ritzel : Lorsque le terrain est en constante évolution, la meilleure réponse consiste à s'assurer que les fondations sont suffisamment souples pour s'adapter. Ce que nous avons observé lors de la première vague de l'IA, alors que l'engouement grandissait mais que cette technologie était encore relativement nouvelle, disons vers 2024, c'est que des services non opérationnels prenaient bon nombre de ces décisions au nom des utilisateurs métier. Il s'agissait notamment des équipes informatiques, de gestion des risques et des achats.
Les divisions ont sans doute mis leur influence en veilleuse parce que le concept était tout nouveau. Elles n’avaient pas encore développé de préférences personnelles. Elles ne s’étaient pas encore familiarisées avec les capacités de ces outils. Et, pour être franc, ces capacités étaient très différentes. En 2024, on parlait de chatbots. Aujourd’hui, on parle de personnes capables de créer des agents en quelques heures. C’est un changement radical.
Cela dit, je m’attends à ce que l’agnosticisme en matière de modèles devienne l’approche dominante, tant chez les entreprises qui développent des solutions spécialisées que chez celles qui les achètent. Mais l’agnosticisme en matière de modèles ne se résume pas à une simple décision. Il ne suffit pas de déclarer : « Nous sommes agnostiques en matière de modèles. » Cela nécessite un investissement considérable en matière d’architecture.
« Lorsque le sol est en perpétuel mouvement, la meilleure solution consiste à s'assurer que les fondations sont suffisamment souples pour s'y adapter. »
Clarity AI en est Clarity AI un bon exemple. Depuis nos débuts, nous avons adopté une architecture indépendante des modèles. La plateforme d'extraction de données que nous avons développée, tant pour notre usage interne que pour nos clients, permet de passer sans difficulté d'un modèle à l'autre, qu'il s'agisse de ceux d'Anthropic, d'OpenAI, de Gemini ou de nombreux autres. Si l'on inclut les modèles à paramètres ouverts, cela représente un accès à plus d'un millier de modèles de base. Un nouvel arrivant peut être intégré en seulement quelques jours. Cela garantit que nous ne dépendons jamais d'un seul laboratoire et que nous ne risquons jamais d'être dépassés par une nouvelle version ou laissés pour compte en cas de panne.
Les acheteurs, quant à eux, devraient s'inspirer d'un exemple récemment donné par Apple. Apple va utiliser Gemini comme base pour ses modèles de fondation, mais avec la sortie d'iOS 27, l'entreprise permettra aux utilisateurs de choisir le fournisseur tiers de leur choix — Gemini, OpenAI, Anthropic — pour alimenter les fonctionnalités de ses logiciels. Une réponse de Siri générée via Claude sera différente de celle générée avec Gemini. Vous pourriez faire ce choix en fonction de vos préférences quant au ton ou à la personnalité du modèle, de sa réputation pour des tâches spécifiques, de la confiance que vous accordez au laboratoire, ou de votre familiarité avec celui-ci dans un contexte professionnel.
Apple ne parie pas sur les chevaux. L'entreprise construit l'hippodrome. C'est exactement l'approche que nous adoptons chez Clarity AI des années, et je pense qu'elle sera de plus en plus adoptée tant par les créateurs que par les acheteurs, à mesure qu'ils prendront conscience que l'exclusivité comporte un risque énorme.
« Apple ne parie pas sur les chevaux. L'entreprise construit l'hippodrome. C'est exactement l'approche que nous adoptons chez Clarity AI des années. »
Lillian Freiberg : Construisez l'hippodrome, ne pariez pas sur le cheval. J'adore cette idée. Pas seulement parce que j'adore parier, mais parce que cela semble évident avec le recul. Mais il est clair que tout le monde n'y a pas pensé assez tôt. Vous avez évoqué le fait que les décisions étaient prises au mauvais niveau. Est-ce que ce schéma se vérifie réellement sur l'ensemble du marché ?
Austin Ritzel : Je pense que oui. Et cette responsabilité n'incombe pas exclusivement au secteur financier. C'est un phénomène qui touche tous les secteurs. Les fonctions centrales telles que l'informatique, la gestion des risques et les achats ont été les premières à évaluer les fournisseurs d'IA, à une époque où cette technologie était encore très novatrice, et les entreprises ont en quelque sorte reporté leur prise de décision. C'est ainsi que certaines entreprises ont approuvé un modèle en 2024 et se retrouvent aujourd'hui prisonnières de ce choix. Et c'est ce que nous entendons tous les deux de la part de nos clients au quotidien.
La meilleure approche a toujours été et restera celle de partir de la base. Il faut d'abord comprendre le cas d'utilisation, puis passer à la sélection des fournisseurs. On commence par les fonctionnalités les plus proches du travail. Si vous envisagez d'adopter un outil d'IA pour les ingénieurs logiciels, vous feriez mieux d'en parler aux ingénieurs logiciels. Si vous envisagez d'adopter un outil pour les chargés de clientèle, vous devez leur parler pour comprendre quelles fonctionnalités sont importantes et lesquelles ne le sont pas. Allez au-delà des belles démonstrations pour vous concentrer sur la valeur réelle.
Une évaluation centrale doit encore venir s'ajouter à tout cela : les services informatiques, de gestion des risques et des achats doivent tous tester ces outils de manière approfondie sous l'angle de la sécurité, comme nous l'avons évoqué. Mais ils devraient rester ouverts à l'influence des unités opérationnelles. Les utilisateurs des unités opérationnelles acquièrent désormais suffisamment de compétences pour exercer une influence sur les évaluations menées par les équipes techniques.
Lillian Freiberg : Et cela nous amène tout naturellement à un phénomène distinct, mais lié. Je pense que c'est bien plus répandu que les entreprises ne veulent bien l'admettre : les personnes qui travaillent au sein de ces institutions savent qu'il existe de meilleurs outils et les utilisent discrètement de toute façon, qu'ils soient approuvés ou non. Quelles conséquences cette pression finit-elle par avoir au niveau institutionnel ?
Austin Ritzel : Je pense que cette utilisation clandestine est le symptôme d’un mal très profond. Ethan Mollick, de Wharton, qui écrit beaucoup sur l’IA en milieu d’entreprise, a baptisé ce profil le « cyborg secret ». Le cyborg secret est silencieux et craintif. C’est un employé qui utilise l’IA pour surpasser ses collègues en toute discrétion, mais qui ne voit aucun avantage ni aucune raison de révéler cette utilisation. Il craint d’être jugé ou redoute que l’IA ne vienne le remplacer. Quelle que soit la raison qui le pousse à garder son utilisation de l'IA secrète, c'est problématique. Et cela indique que l'entreprise elle-même n'a pas établi la bonne relation interne avec l'IA. C'est là le mal dont ce personnage est le symptôme.
Les conséquences sont graves. Il existe des problèmes tels que l’exfiltration de données via l’historique des requêtes : si vous utilisez des versions non sécurisées et non professionnelles d’outils, vous risquez de transmettre des informations sensibles à des systèmes susceptibles de s’en servir pour leur apprentissage, et ces informations pourraient réapparaître dans les réponses fournies à d’autres utilisateurs. Cela entraîne des résultats incohérents d’une équipe à l’autre. Mais le problème le plus coûteux est peut-être qu'il crée des lacunes en matière de capacités. Cela réduit l'efficacité de votre personnel et creuse un fossé croissant entre les entreprises où ces « cyborgs secrets » sont omniprésents et celles qui ont mis en place des environnements d'IA permissifs et bien gérés, où les employés utilisent leurs outils sans craindre de représailles.
La solution consiste à mettre en place une gouvernance axée sur la manière dont les employés utilisent l'IA — et non sur la question de savoir s'ils l'utilisent ou non —, car ils vont inévitablement y avoir recours. Il faut également changer de perspective, en partant du sommet vers la base : l'IA est un catalyseur du travail d'expert, et non un substitut à celui-ci. Un employé qui s'appuie sur l'IA accomplit bien plus qu'un employé remplacé par l'IA. Les entreprises qui parviennent à faire plus avec les mêmes ressources, plutôt que de se contenter de faire la même chose avec moins, seront véritablement les gagnantes.
Lillian Freiberg : Je vois. Le cyborg secret. Silencieux et craintif. Je vois s'ouvrir pour eux un tout nouveau créneau thérapeutique.
Austin Ritzel : En effet. Ou une série de science-fiction.
Lillian Freiberg : On pourrait le vendre à Star Wars.
Austin Ritzel : C'est un épisode de Star Wars vraiment triste, mais oui.
« Un employé dont le travail est facilité par l’IA accomplit bien plus qu’un employé remplacé par l’IA. Les entreprises qui parviennent à faire plus avec les mêmes ressources, plutôt que de se contenter de faire la même chose avec moins, seront véritablement les gagnantes. »
4e partie : Construire ou acheter — Et quel est le coût réel de cet éléphant blanc ?
Lillian Freiberg : Certaines entreprises qui observent cette évolution ont adopté une réponse qui semble raisonnable à première vue : « Si nous ne trouvons pas le bon fournisseur, nous le développerons nous-mêmes. » Posséder la pile technologique, contrôler la feuille de route, ne dépendre d’aucun fournisseur externe. J’ai entendu cet argument avancé de manière convaincante dans de nombreuses salles de réunion. Mais la mise en œuvre est très différente de la présentation. Que pensez-vous de ce compromis ?
Austin Ritzel : Il y a deux niveaux qu’il faut distinguer lorsqu’on parle de « développer soi-même » ou « acheter ». Le premier concerne les modèles de base : ce que DeepMind de Google développe dans Gemini, ce qu’Anthropic développe dans Claude, ce qu’OpenAI développe dans ChatGPT. Presque aucune institution financière n’envisage sérieusement de développer un modèle de base. Le déficit de compétences est énorme, les dépenses d’investissement requises sont énormes, et les contraintes informatiques sont énormes. Mais le développement d’outils et d’applications spécialisés qui exploitent l’IA comme capacité centrale — plateformes d’extraction de données, générateurs de rapports, copilotes — voilà un sujet plus intéressant, et c’est là que se situent les véritables compromis.
Avec les outils d’aujourd’hui, on pourrait théoriquement créer son propre Gmail, son propre Slack, son propre HubSpot. Rares sont ceux qui le font réellement à l’échelle de l’entreprise. Non pas parce qu’ils en seraient techniquement incapables, mais parce que le coût nécessaire pour bien le mettre en place — puis pour le faire fonctionner correctement et l’entretenir — éclipserait de loin tout avantage imaginable lié à la possession de cette pile complète. Cela devient un éléphant blanc maudit. Vous avez acheté cet éléphant, et vous devez maintenant trouver comment le nourrir et le faire fonctionner.
Il y a trois raisons pour lesquelles la promotion interne a tendance à ne pas tenir ses promesses :
- Tout d'abord, il y a un coût d'opportunité évident. Chaque ingénieur affecté au développement d'un outil d'IA interne est un ingénieur qui ne travaille pas sur les compétences clés de l'institution.
- Deuxièmement, les outils spécialisés s'accompagnent d'experts : des spécialistes qui maîtrisent parfaitement le sujet et en sont les experts. Chez Clarity AI, nous avons passé une décennie à collecter, valider, enrichir et organiser un vaste corpus de données sur le développement durable provenant de centaines de clients, à l'aide de méthodologies exclusives conçues spécialement à cette fin. Cette expertise ne cesse de s'enrichir. Une équipe interne partant de zéro aura du mal à atteindre ce niveau de profondeur.
- Troisièmement — et c'est un point sur lequel notre directeur technique insiste particulièrement —, la maintenance est discrète, mais extrêmement coûteuse. Nous assurons la mise à jour de plus de 400 méthodologies métriques et de 20 méthodologies au niveau des produits, nous évaluons et intégrons de nouveaux modèles, et nous adaptons les processus à mesure que les modèles de base évoluent et que les cadres réglementaires changent. Nous pouvons répartir cette charge sur des centaines de clients. Une équipe interne, en revanche, doit en assumer seule le poids, indéfiniment.
« Rares sont ceux qui développent aujourd’hui des outils destinés à un usage quotidien au niveau de l’entreprise. Non pas parce qu’ils en seraient techniquement incapables, mais parce que le coût nécessaire pour les mettre au point — puis pour les maintenir à niveau et les faire évoluer — éclipserait de loin tout avantage imaginable lié à la possession d’une pile technologique complète. »
JP Morgan en est un bon exemple. La banque dispose de plus de capitaux et d'ingénieurs que bon nombre d'entreprises technologiques. Jamie Dimon a déclaré : « Nous sommes une entreprise technologique qui, par la suite, s'est lancée dans la finance. » Et pourtant, elle s'associe à Anthropic au niveau des modèles et acquiert des fournisseurs spécialisés au niveau des flux de travail et des outils. Il s'agit d'acquérir le cœur de métier et de développer les périphéries.
Lillian Freiberg : Il y a aussi la question de la stabilité financière qui se cache derrière tout cela et dont, à mon avis, trop peu d’entreprises tiennent compte. Aucun des principaux fournisseurs de modèles de base n’est rentable. Certains sont lourdement endettés. Si l’un d’entre eux venait à connaître de graves difficultés, qu’adviendrait-il de tous ceux qui ont construit leurs solutions à partir de ces modèles ? Est-ce un risque que les gens prennent réellement en compte ?
Austin Ritzel : C'est une très bonne question. Et je tiens à préciser qu'Alphabet constitue ici un cas particulier : Alphabet est extrêmement rentable. Mais si l'on considère DeepMind, le laboratoire interne qui développe Gemini, DeepMind n'est pas rentable en soi. Sur le plan des coûts globaux, sa situation ressemble probablement beaucoup à celle d'Anthropic ou d'OpenAI.
Se focaliser excessivement sur un seul modèle comporte des risques, même en faisant abstraction des considérations financières. Je pense que le modèle économique commence à porter ses fruits en matière d'inférence. Mais l'entraînement coûte très cher, et ces préoccupations sont bien réelles. Et aucun de ces laboratoires de recherche fondamentale n'est une fatalité.
Nous en avons eu un bon exemple récemment : Elon Musk a loué son plus grand centre de données, situé près de Memphis, le Colossus Data Center, à Anthropic. Parallèlement, Musk possède également Grok. Et il semble qu’il ait de fait abandonné l’idée de faire de Grok un modèle de référence en louant toute cette capacité de calcul à Anthropic. Les entreprises doivent être capables de résister à tout choc exogène, qu’il s’agisse d’une faillite ou simplement d’un retard pris par l’un de leurs collaborateurs.
C'est là tout l'intérêt de l'approche d'architecture ouverte . Il s'agit de mettre en place une infrastructure qui permette de s'adapter et de changer de cap lorsqu'un élément prend du retard ou tombe complètement à l'eau. Chez Clarity AI, notre plateforme d'extraction de données utilise tous les modèles que j'ai mentionnés, non seulement parce que certains modèles sont mieux adaptés à certaines tâches, mais aussi parce que nous voulons éviter le risque de concentration lié au fait de s'en tenir à un seul laboratoire.
« L'intérêt de l'approche à architecture ouverte réside dans la mise en place d'une base qui permet de s'adapter et de changer de cap lorsqu'un participant prend du retard ou abandonne complètement. »
Il y a aussi une question philosophique plus large sur laquelle je me penche depuis quelque temps. La dépendance que nous avons développée ces dernières années vis-à-vis des grands laboratoires financés par des fondations est-elle suffisante pour que nous les considérions comme « trop grands pour faire faillite » ?
Lillian Freiberg : Je vois les choses sous différents angles. Je vois beaucoup de gens défendre ce point de vue des deux côtés. Mais ce qui est absolument certain, c’est qu’aucune institution financière — aucune entreprise — ne devrait se mettre dans une situation où elle subirait personnellement les conséquences d’une réponse qui ressemblerait à un « non » à cette question.
5e partie : Qui sort réellement gagnant ?
Lillian Freiberg : Quand on aborde tout cela, en particulier pour les sociétés financières, on parle de perte d’avantage concurrentiel, de perte d’alpha. Ce qui m’amène à ce qui, selon moi, constitue la thèse sous-jacente à toute cette discussion. Comment ce marché va-t-il réellement évoluer ? Mon intuition, d’après ce que j’entends de la part des clients et des leaders d’opinion, est que les acteurs spécialisés, ceux qui possèdent une véritable expertise dans un domaine spécifique et qui sont capables d’opérer quel que soit le modèle déjà approuvé par le client, finiront par occuper la position la plus forte. Est-ce également votre point de vue ?
Austin Ritzel : Oui. Et je pense que ce sont sans doute les réalités économiques qui imposent cette situation. La couche de base va probablement se banaliser dans une certaine mesure. Sam Altman lui-même a comparé l'état final d'OpenAI à un service public. Et à mesure que cette couche se banalise, on voit sans doute la valeur ajoutée se déplacer vers les couches de la pile capables d'accomplir des tâches qu'un modèle général ne peut pas réaliser.
Considérez le LLM comme un moteur. Les entreprises qui se démarquent sont celles qui parviennent à construire un châssis autour de lui : une véritable expertise sectorielle, des connaissances triées sur le volet, des méthodologies déterministes qui transforment ce qui est, à la base, un outil probabiliste. Deux personnes posant la même question doivent obtenir la même réponse. Vous avez besoin d'évaluations. Vous avez besoin d'examens par des experts impliquant une intervention humaine. Les personnes capables de construire ce châssis — la direction, les freins, la carrosserie — vont tirer une valeur très particulière de cet écosystème.
L'infrastructure de vérification sera également essentielle, en particulier pour les institutions financières ou toute autre entité évoluant dans un secteur réglementé. L'explicabilité, la traçabilité jusqu'à une base de données contrôlée, la traçabilité de la transformation depuis les données brutes et la méthodologie jusqu'au résultat final : voilà ce qui rend ces résultats réellement exploitables dans des contextes réglementés.
« Considérez le LLM comme un moteur. Les entreprises qui se démarquent sont celles qui parviennent à construire un châssis autour de lui : une véritable expertise sectorielle, des connaissances triées sur le volet, des méthodologies déterministes qui transforment ce qui est, à la base, un outil probabiliste. »
Lillian Freiberg : Tout à fait. Et surtout pour les clients du secteur financier — traçabilité, confiance, solutions prêtes pour l'IC et l'audit — c'est primordial. Donc, en tenant compte de tout cela, qu'est-ce qui distingue réellement les fournisseurs spécialisés qui sortent renforcés de cette épreuve de ceux qui ne survivent pas ?
Austin Ritzel : Plusieurs choses. La flexibilité architecturale, l'indépendance vis-à-vis des modèles. Une véritable expertise du domaine : mettre en avant les données propriétaires et les méthodologies permettant de transformer des résultats probabilistes en résultats déterministes. À l'avenir, les données constitueront un véritable avantage concurrentiel.
De plus, les prestataires spécialisés qui se démarquent de la concurrence exigeront également une infrastructure d'auditabilité extrêmement solide. Il ne s'agit pas seulement de numéros de page, mais aussi de la géométrie des citations : l'emplacement exact sur la page, la position précise de l'information. La traçabilité de la source. Transformations vérifiables : comment les données brutes trouvées sur la page ont-elles été transformées en un résultat final dans un rapport généré automatiquement ? Comment réduire au plus près de zéro la charge de vérification, c'est-à-dire le temps nécessaire pour confirmer que l'IA a produit un résultat exact ?
Les « wrappers » — ces entreprises qui se contentent de créer de jolies interfaces utilisateur en s’appuyant sur un modèle polyvalent dépourvu de toute expertise métier — risquent fort d’être phagocytées. Ce qui vous permettra de vous démarquer, ce sont les données sélectionnées ou propriétaires, des résultats vérifiables et transparents qui allègent la charge de vérification, ainsi que la capacité à accomplir ce que ces modèles généraux sont tout simplement incapables de faire.
Lillian Freiberg : « Des emballages fins qui se font engloutir. » Je crois que c'est la phrase du jour. Austin, merci. C'était vraiment génial. Tu as failli enchaîner trois fois de suite sur le « modèle agnostique », mais tu as réussi à rendre tout ça compréhensible, et ce n'est pas une mince affaire.
Austin Ritzel : Merci, Lillian.





