Ein Gespräch mit Lillian Freiberg und Austin Ritzel
Die KI entwickelt sich schneller, als die meisten Finanzunternehmen damit Schritt halten können. In diesem Gespräch geht es darum, was das konkret bedeutet: für die Sicherheit, die Anbieterstrategie und die Mitarbeiter in Ihrem Unternehmen, die sich still und leise selbst damit auseinandersetzen, ohne dass Sie davon wissen.
Teil 1: Der „Mythos-Moment“ – Als ein Modell zu gefährlich war, um es auf den Markt zu bringen
Lillian Freiberg: Hallo zusammen. Herzlich willkommen. Mein Name ist Lillian Freiberg. Ich bin Leiterin der Nordamerika-Abteilung bei Clarity AI. Bei mir ist mein Kollege Austin Ritzel, unser Senior Manager für KI-Strategie und strategische Projekte. Er ist im Grunde genommen derjenige, den ich belästige, wenn in der KI-Welt etwas schiefgeht und ich wissen muss, wie sich das auf meine Kunden und mich auswirken wird.
Wir werden viele Themen behandeln. Wie schnell sich diese Technologie tatsächlich weiterentwickelt. Was das für Unternehmen bedeutet, die versuchen, Schritt zu halten, und welche strategischen Entscheidungen den Gewinner von denen unterscheiden werden, die noch immer damit beschäftigt sind, die Entscheidungen zu entwirren, die sie vor zwei Jahren getroffen haben.
Austin Ritzel: Danke, Lillian. Diese Einleitung ist einfach unschlagbar. Du hast mich gut in Szene gesetzt. Ich weiß, dass wir heute viel zu besprechen haben. An faszinierenden Themen mangelt es in der Welt der KI derzeit nicht.
Lillian Freiberg: Fangen wir mit etwas an, das die Leute vor ein paar Monaten wirklich aufgerüttelt hat. Und falls das für euch neu ist, werde ich euch eine kurze Zusammenfassung geben.
Anthropic – die Macher von Claude, einem der führenden KI-Labore – haben ein Modell namens Mythos veröffentlicht. KI-Veröffentlichungen finden ständig statt. Doch diese kam ganz anders an. Mythos wurde entwickelt, um beim Programmieren herausragende Leistungen zu erbringen. Was niemand vollständig vorausgesehen hatte, war, dass dieselben Fähigkeiten, die es beim Schreiben von Code so gut machten, es im Grunde auch zum leistungsstärksten Scanner für Sicherheitslücken machten, den es je gab. Allein in Firefox wurden fast 200 schwerwiegende Fehler entdeckt. Zum Vergleich: Das Vorgängermodell hatte nur zwei Monate zuvor etwa 20 Fehler gefunden.
Das war der Punkt, der die Aufmerksamkeit der Öffentlichkeit wirklich auf sich zog. Anthropic entschied sich freiwillig, die Technologie nicht öffentlich zu veröffentlichen. Das Unternehmen gewährte rund 40 Institutionen – großen Finanzunternehmen, Tech-Firmen und Betreibern kritischer Infrastruktur – Zugang, damit sich die Verteidiger wappnen konnten, bevor diese Fähigkeit in die breite Öffentlichkeit gelangte. Eine solche freiwillige Zurückhaltung in diesem Ausmaß hatte es zuvor noch nicht gegeben. Das ließ in Washington und Brüssel die Alarmglocken läuten und zwang zu einer ernsthaften Auseinandersetzung darüber, wo der KI-Wettlauf tatsächlich steht.
Mein erster Eindruck ist, dass wir noch lange nicht am Ziel sind. Was denkst du?
„Für den rechtschaffenen Akteur ist das ein äußerst wirksamer Schutzschild. Für ruchlose Akteure ist Mythos eine äußerst mächtige Angriffswaffe.“
Austin Ritzel: In einem Umfeld, in dem wir scheinbar alle paar Wochen entscheidende, beispiellose Momente erleben, war dies wirklich ein sehr bedeutender Moment für die KI-Landschaft. Dafür gab es mehrere Gründe.
Erstens ist Mythos, wie Sie bereits erwähnt haben, in seiner Fähigkeit, Sicherheitslücken aufzudecken, einzigartig leistungsstark, was natürlich Bedenken hinsichtlich der doppelten Verwendbarkeit mit sich bringt. Einerseits ist es für den rechtschaffenen Akteur ein sehr robuster Schutzschild. Für böswillige Akteure hingegen ist Mythos eine sehr mächtige Angriffswaffe – ein Schwert, um die Metapher zu Ende zu führen.
Der zweite Grund, warum dies so bedeutend war, ist der Gedanke, den Sie angesprochen haben: Modelle werden „gezüchtet“, nicht „gebaut“. Das ist eine völlig andere Art, über Technologie nachzudenken. Das ist keine Idee, die ich erfunden habe. Tatsächlich beschreibt Dario Amodei, der CEO von Anthropic, den Prozess der Modellerstellung genau so. Mythos wurde nicht speziell für Cybersicherheits-Scans optimiert. Es wurde für das Programmieren optimiert, wie viele große Sprachmodelle. Aber dieselben Fähigkeiten, dieselben Funktionen, die es beim Programmieren so großartig machten, machten es auch bei der Erkennung von Schwachstellen absolut produktiv.
„Mythos stellt einen deutlichen Fortschritt gegenüber den Möglichkeiten von Opus 4.6 beim Scannen nach Sicherheitslücken dar. Eine große Veränderung.“
Es gab einige Leute, die anfangs sagten, das sei der größte Marketing-Hype aller Zeiten – ein Modell, das zu leistungsstark sei, um es auf den Markt zu bringen. Doch schon bald darauf stellten wir fest, dass es sich dabei keineswegs um einen Marketing-Hype handelte. Es ist ein Quantensprung gegenüber dem, was das Vorgängermodell Opus 4.6 in Bezug auf die Suche nach Sicherheitslücken leisten konnte. Eine große Veränderung.
Nebenbei möchte ich noch anmerken, dass diese Idee der übertragbaren Fähigkeiten von einem Bereich auf einen anderen – das ist etwas, was wir im Finanzwesen beobachten. Viele der Elemente, die große Sprachmodelle beim Programmieren so leistungsfähig machen, wie zum Beispiel Logik, machen sie in erster Linie auch bei vielen Aufgaben im Finanzwesen leistungsfähig.
Der dritte Grund, warum dies eine so große Sache war: Anthropic hat die Veröffentlichung aus eigenem Antrieb zurückgehalten und das Modell diesen 40 – mittlerweile sind es wohl 70 – Institutionen zur Verfügung gestellt, damit diese ihre Abwehrmaßnahmen verstärken konnten. Dies geschah auch teilweise aufgrund von Bedenken hinsichtlich der Rechenleistung. Mythos ist ein sehr großes Modell.
„Die Trump-Regierung hat die Idee ins Spiel gebracht, KI-Labore dazu zu verpflichten, ihre Modelle vor der Veröffentlichung den Bundesbehörden vorzulegen. Sozusagen eine Art FDA für den KI-Bereich.“
Das löste eine sehr interessante Reaktion der Trump-Regierung aus. Ideologisch gesehen hat sich die Regierung stets gegen Regulierung ausgesprochen, insbesondere im Bereich der KI – eine der ersten Durchführungsverordnungen diente dazu, eine von der Biden-Regierung eingeführte Regelung aufzuheben. Nun hat sie jedoch die Idee einer Durchführungsverordnung ins Spiel gebracht, die KI-Labore dazu verpflichten soll, ihre Modelle vor der Veröffentlichung den Bundesbehörden vorzulegen. Dies wurde als eine Art „FDA für den KI-Bereich“ beschrieben. Eine große Veränderung für die Regulierungslandschaft.
Dies löste auch eine Reaktion der EU aus, da sie im Stich gelassen wurde – auch keine in der EU ansässige Institution hatte Zugang. Zudem stellen sich Fragen hinsichtlich eines freien und fairen Zugangs für alle Regierungen, um ihre Verteidigungsmaßnahmen zu stärken.
Um jedoch auf den ersten Teil Ihrer Frage einzugehen: Ist das Wettrennen um die KI noch lange nicht entschieden? Auf jeden Fall. Experten gehen allgemein davon aus – und das sagen die CEOs dieser Unternehmen –, dass die US-Labore derzeit nur etwa 1 bis 3 Monate voreinander oder hintereinander liegen. Chinesische Labore wie DeepSeek liegen etwa 6 bis 12 Monate zurück. Sie liegen sehr, sehr dicht beieinander. Und ich denke, wir sollten daher damit rechnen, dass sich die Rangordnung in diesem Bereich ständig neu ordnet.
Teil 2: Warum die Finanzdienstleistungsbranche im Mittelpunkt steht
Lillian Freiberg: Interessant. Auch wenn Anthropic gerade im Rampenlicht steht, ist der Sieger noch nicht feststehen. Der Wettlauf ist noch in vollem Gange. Und wie Sie bereits angemerkt haben, spielt sich dieser Wettlauf besonders deutlich im Finanzdienstleistungssektor ab. Jeder große KI-Anbieter drängt massiv in diese Branche vor. Würden Sie sagen, dass dies strukturell bedingt ist, oder liegt es einfach daran, dass dort das Geld zu holen ist?
Austin Ritzel: Ich denke, beides. Was die strukturelle Seite angeht, so machen viele der Eigenschaften, die große Sprachmodelle beim Programmieren so gut machen, sie auch bei Finanzabläufen sehr gut – oder zumindest bei vielen Finanzabläufen, sicherlich nicht bei allen. Anthropic selbst schätzt, dass der Finanzbereich auf der Automatisierungskurve gerade mal etwa 6 bis 12 Monate hinter dem Programmieren zurückliegt. Und jeder, der sich auch nur ein wenig mit dem KI-Bereich beschäftigt hat, weiß, was derzeit im Bereich des Programmierens vor sich geht.
Dort liegt zweifellos auch das große Geld. Die großen Labore erschließen im Finanzsektor erhebliche Umsatzpotenziale. Für Anthropic – und ich erwähne das Unternehmen, weil es gerade eine ganze Reihe von Daten dazu veröffentlicht hat – steht die Finanzbranche gemessen am Umsatz an zweiter Stelle unter allen Branchen. Sie liegt damit nur hinter der Technologiebranche, und 40 % der 50 größten Kunden des Unternehmens sind Finanzinstitute.
Lillian Freiberg: Das leuchtet mir durchaus ein. Aber sechs bis zwölf Monate Rückstand bei der Programmierung … Ich habe das Gefühl, dass das tatsächlich näher liegt, als den meisten Menschen bewusst ist. Und doch sind Finanzdienstleistungen bekannt dafür, eine sehr träge Branche zu sein. Beschaffungszyklen, Risikogenehmigungen, Compliance-Freigaben. Ist das Tempo der KI-Entwicklung nur ein vorübergehendes Problem für die Branche, oder gibt es hier ein grundlegenderes Missverhältnis?
„Die großen Labore erschließen im Finanzsektor erhebliche Umsatzpotenziale. Gemessen am Umsatz liegt die Finanzbranche für Anthropic auf Platz zwei aller Branchen.“
Austin Ritzel: Ich denke, wir müssen das von Grund auf betrachten. Woher kommt die Reibung? Es scheint sowohl verfahrenstechnische als auch strukturelle Reibungspunkte zu geben.
Verfahrenstechnische Reibungsverluste – Dokumentationszyklen, die Einbindung von Lieferanten und Ähnliches – könnten durch KI wahrscheinlich weitgehend reduziert werden. Die strukturellen Reibungsverluste sind wahrscheinlich beständiger. Und mit strukturellen Reibungsverlusten meine ich Regulierung, Treuhandpflichten und die persönliche Verantwortung für Entscheidungen in stark regulierten Bereichen. Diese lassen sich in der Finanzwelt wohl am besten als „Features“ und nicht als „Bugs“ bezeichnen, zumal diese Welt durch KI herausgefordert wird, wo die Kosten für Fehlentscheidungen sehr hoch sind.
Die potenziell größere strukturelle Herausforderung ist ein Konzept, über das ich bereits geschrieben habe und das ich als „Silicon Ceiling“ bezeichne: die Grenze der Fähigkeit eines Unternehmens, neue Kompetenzen zu integrieren. Dazu gehören Dinge wie Change Management, das Schließen von Qualifikationslücken bei den Mitarbeitern und die Schulung der Mitarbeiter. Es besteht ein Missverhältnis zwischen der Geschwindigkeit, mit der neue Fähigkeiten an der Spitze entstehen, und der Geschwindigkeit, mit der diese von der Organisation aufgenommen werden. Und das ist kein Phänomen, das nur Finanzinstitute betrifft. Die Umfrage „2026 State of AI in the Enterprise“ von Deloitte ergab, dass die Qualifikationslücke im Bereich KI als das größte Hindernis für die Integration in Unternehmen wahrgenommen wird. Diese eher schwer fassbare Seite der strukturellen Barriere ist also von entscheidender Bedeutung, um zu verstehen, wie schnell sich alle Unternehmen bewegen können.
Ich gehe davon aus, dass sich diese Kluft wahrscheinlich noch vergrößern wird, bevor sie sich wieder verringert. Es wird sich jedoch eine Kluft zwischen den Unternehmen auftun, die in Absorptionskapazitäten investieren – was im Grunde bedeutet, dass sie in Menschen und Prozesse als strategisches Kapital investieren –, und denen, die dies nicht tun. Ich gehe davon aus, dass sich die erstgenannten Unternehmen weiter absetzen werden.
„Die potenziell größere strukturelle Herausforderung ist die sogenannte ‚Silicon Ceiling‘: die Grenze der Fähigkeit eines Unternehmens, neue Kompetenzen zu integrieren. Dazu gehören Aspekte wie Change Management, das Schließen von Qualifikationslücken bei den Mitarbeitern und die Weiterbildung der Belegschaft. Es besteht ein Missverhältnis zwischen der Geschwindigkeit, mit der neue Kompetenzen an der Spitze der Entwicklung entstehen, und der Geschwindigkeit, mit der diese von der Organisation aufgenommen werden.“
Lillian Freiberg: Mir gefällt dieser flexible Ansatz. Und der Begriff „Silicon Ceiling“ ist ein so nützlicher Rahmen, weil nicht unbedingt die Technologie das Problem ist. Es sind die Menschen, die Organisation, die Integration. Und das hängt direkt mit etwas zusammen, das wir unbedingt ansprechen sollten, bevor wir weitermachen, denn es ist so wichtig und ich werde ständig danach gefragt. Es geht um Cybersicherheit. Mythos hat das sehr anschaulich gemacht . Was passiert eigentlich mit der Angriffsfläche eines Finanzinstituts, wenn Modelle schneller eingesetzt werden?
Austin Ritzel: Das ist eine wirklich wichtige Frage, und sie rückt die Trägheit der Finanzinstitute tatsächlich in ein sehr positives Licht. Anstelle von Trägheit sieht man darin Bedachtsamkeit.
Die Geschwindigkeit der Modellbereitstellung verändert die Angriffsfläche über zwei Hauptvektoren. Der erste besteht darin, dass eine Asymmetrie zwischen offensiven und defensiven Fähigkeiten besteht. Der Zyklus zwischen der Entstehung einer Fähigkeit, ihrem Durchbruch in die Praxis und ihrer Verbreitung in der Praxis – dieser Zyklus wird immer kürzer. Und wenn sich diese Zeitspanne verkürzt, bleibt den Verteidigern nicht nur weniger Zeit, um die Lücken zu schließen. Es bleibt ihnen auch weniger Zeit, um zu verstehen, wogegen sie eigentlich Maßnahmen ergreifen. Die Entscheidung von Anthropic, Mythos zurückzuhalten, ist das bisher beste Beispiel dafür, wie ein Unternehmen auf die Bremse tritt, versucht, die Fähigkeit vom Einsatz zu trennen, und allen ein wenig Vorbereitungszeit verschafft.
Der zweite Aspekt ist, dass sich traditionelle Sicherheitsperimeter wandeln, insbesondere da KI zunehmend eigenständig agiert und tatsächlich Dinge tut. KI mit „Händen“ ist ein ganz anderes Thema als ein „Gehirn im Glas“. Jede KI-Integration impliziert die Einrichtung eines neuen Perimeters. Ein Agent mit Zugriff auf Kalender, E-Mail, Dateisystem … Das passt nicht mehr nahtlos in die Modelle mit minimalen Berechtigungen, auf die wir uns bisher verlassen haben. Sicherheitspraktiken müssen sich wahrscheinlich grundlegend ändern, um diesem Tempo des Wandels gerecht zu werden. Anstatt die Sicherheitslage jährlich zu aktualisieren, muss dies viel eher in monatlichen Abständen geschehen, um mit dem Tempo der KI-Entwicklung Schritt zu halten.
„Herkömmliche Sicherheitsgrenzen verschieben sich, insbesondere da KI zunehmend eigenständig handelt und tatsächlich Dinge tut. KI mit eigenen Händen ist ein ganz anderes Thema als ein Gehirn im Glas.“
Teil 3: Die falsche Entscheidung auf der falschen Ebene
Lillian Freiberg: Für manche Unternehmen wird das eine enorme Umstellung sein. Lassen Sie uns also das Thema etwas wechseln und über ein Problem sprechen, mit dem vermutlich viele Menschen derzeit stillschweigend leben.
Nehmen wir einmal an: Vor 18 Monaten hat Ihr Unternehmen den gesamten Prozess durchlaufen: IT-Prüfung, Risikoabnahme, Compliance-Freigabe – und ein Basismodell genehmigt. Es wurden Ressourcen investiert. Nun hat sich die Lage geändert, und Sie schauen sich um und fragen sich: Haben wir auf das richtige Pferd gesetzt?
Ein wesentlicher Grund dafür, dass sich die Situation verschlimmert hat, ist, dass viele dieser Entscheidungen auf der falschen Ebene getroffen wurden. Die Risiko- oder IT-Abteilung hat etwas genehmigt, bevor die Fachabteilungen wirklich verstanden hatten, was sie da eigentlich kauften, wie sie es nutzen wollten oder wer es überhaupt nutzen würde. Nun hat man einen Vertrag, darauf aufbauende Arbeitsabläufe, und der Rest der Welt hat sich weiterentwickelt.
Austin, lässt sich das lösen? Oder muss die Branche diese frühen Entscheidungen einfach noch eine Weile mit sich herumschleppen?
Austin Ritzel: Wenn sich der Boden ständig verschiebt, besteht die beste Vorgehensweise darin, sicherzustellen, dass die Fundamente flexibel genug sind, um sich anzupassen. Was wir in der ersten KI-Welle beobachtet haben – als die Begeisterung wuchs, die Technologie aber noch recht neu war, etwa im Jahr 2024 –, war, dass nicht-geschäftliche Abteilungen viele dieser Entscheidungen im Namen der geschäftlichen Nutzer trafen. IT-, Risiko- und Beschaffungsteams.
Die Geschäftsbereiche haben ihren Einfluss wahrscheinlich zurückgestellt, weil das Ganze so neu war. Sie hatten noch keine persönlichen Vorlieben entwickelt. Sie hatten sich noch nicht damit vertraut gemacht, wozu diese Tools fähig waren. Und ehrlich gesagt waren die Funktionen sehr unterschiedlich. Im Jahr 2024 sprachen wir noch von Chatbots. Jetzt sprechen wir davon, dass Menschen innerhalb weniger Stunden Agenten erstellen können. Das ist eine enorme Veränderung.
Dennoch gehe ich davon aus, dass sich die Modellunabhängigkeit als vorherrschender Ansatz durchsetzen wird – sowohl bei Unternehmen, die spezialisierte Lösungen entwickeln, als auch bei denjenigen, die diese Lösungen erwerben. Modellunabhängigkeit ist jedoch nicht einfach eine Entscheidung, die man trifft. Es reicht nicht aus, nur zu sagen: „Wir sind modellunabhängig.“ Sie erfordert enorme Investitionen in die Architektur.
„Wenn sich der Boden ständig verschiebt, besteht die beste Lösung darin, dafür zu sorgen, dass die Fundamente flexibel genug sind, um sich anzupassen.“
Clarity AI liefert Clarity AI ein anschauliches Beispiel. Wir verfügen seit unserer Gründung über eine modellunabhängige Struktur. Die von uns entwickelte Datenextraktionsplattform, die sowohl für den internen Gebrauch als auch für Kunden bestimmt ist, ermöglicht einen reibungslosen Wechsel zwischen Modellen von Anthropic, OpenAI, Gemini und vielen anderen Anbietern. Bezieht man Modelle mit offenem Gewicht mit ein , haben wir Zugriff auf mehr als tausend Grundmodelle. Ein neuer Anbieter kann in nur wenigen Tagen integriert werden. Das stellt sicher, dass wir niemals von einem einzigen Labor abhängig sind und niemals Gefahr laufen, durch eine neue Version überholt zu werden oder durch einen Ausfall im Stich gelassen zu werden.
Die Käufer auf der anderen Seite sollten sich ein Beispiel nehmen, das Apple kürzlich gegeben hat. Apple wird Gemini als Grundlage für seine Basis-Modelle nutzen, aber mit der Veröffentlichung von iOS 27 wird es den Nutzern möglich sein, den Drittanbieter ihrer Wahl – Gemini, OpenAI, Anthropic – auszuwählen, um Funktionen in ihrer gesamten Software zu nutzen. Eine über Claude generierte Siri-Antwort wird sich von einer unterscheiden, die mit Gemini generiert wurde. Diese Wahl könnte man treffen, je nach Vorliebe für den Tonfall oder die Persönlichkeit des Modells, dessen Ruf bei bestimmten Aufgaben, dem Vertrauen in das Labor oder der Vertrautheit mit dem Modell aus dem beruflichen Umfeld.
Apple setzt nicht auf die Pferde. Sie bauen die Rennbahn. Genau diesen Ansatz verfolgen wir bei Clarity AI Jahren, und ich gehe davon aus, dass er sowohl von Entwicklern als auch von Käufern zunehmend übernommen wird, sobald ihnen klar wird, dass Exklusivität ein enormes Risiko birgt.
„Apple setzt nicht auf die Pferde. Sie bauen die Rennbahn. Genau diesen Ansatz verfolgen wir bei Clarity AI Jahren.“
Lillian Freiberg: Bau die Rennbahn, statt auf das Pferd zu wetten. Das finde ich großartig. Nicht nur, weil ich gerne wette, sondern weil es im Nachhinein so naheliegend klingt. Aber offensichtlich ist nicht jeder frühzeitig darauf gekommen. Du hast erwähnt, dass Entscheidungen auf der falschen Ebene getroffen werden. Lässt sich dieses Muster tatsächlich auf den gesamten Markt übertragen?
Austin Ritzel: Das glaube ich auch. Und diese Schuld liegt nicht ausschließlich bei der Finanzbranche. Das spielt sich branchenübergreifend ab. Zentrale Funktionen wie IT, Risikomanagement und Beschaffung hatten damals, als KI noch extrem neu war, das Vorrecht bei der Bewertung von KI-Anbietern, und die Unternehmen haben ihren Einfluss gewissermaßen zurückgestellt. So kommt es, dass es Unternehmen gibt, die 2024 ein Modell genehmigt haben und nun daran gebunden sind. Und genau das hören wir beide tagtäglich von unseren Kunden.
Der kluge Schachzug war und bleibt, von unten nach oben vorzugehen. Man muss zuerst den Anwendungsfall verstehen und dann die Anbieterauswahl treffen. Man beginnt mit den Funktionen, die der Arbeit am nächsten sind. Wenn man darüber nachdenkt, ein KI-Tool für Softwareentwickler einzuführen, sollte man besser mit den Softwareentwicklern sprechen. Wenn man darüber nachdenkt, ein Tool für Kundenbetreuer einzuführen, muss man mit den Kundenbetreuern sprechen, um zu verstehen, welche Funktionen wichtig sind und welche nicht. Geht über hübsche Demos hinaus und konzentriert euch auf den tatsächlichen Nutzen.
Die zentrale Bewertung muss noch hinzukommen – IT, Risikomanagement und Beschaffung müssen diese Tools, wie bereits besprochen, unter Sicherheitsgesichtspunkten auf Herz und Nieren prüfen. Dabei sollten sie jedoch offen für den Einfluss der Geschäftsbereiche sein. Die Anwender in den Geschäftsbereichen werden zunehmend kompetent genug, um Einfluss auf die Bewertungen der technischen Teams zu nehmen.
Lillian Freiberg: Und das führt nahtlos zu einem anderen, aber damit zusammenhängenden Phänomen. Ich glaube, es ist weitaus verbreiteter, als die Unternehmen zugeben wollen: Die Mitarbeiter dieser Institutionen wissen, dass es bessere Tools gibt, und nutzen diese trotzdem stillschweigend – ob genehmigt oder nicht. Was bewirkt dieser Druck letztendlich auf institutioneller Ebene?
Austin Ritzel: Ich glaube, diese heimliche Nutzung ist symptomatisch für ein sehr tiefsitzendes Problem. Ethan Mollick von der Wharton School, der viel über KI im Unternehmenskontext schreibt, hat diesen Typus als „Secret Cyborg“ bezeichnet. Der „Secret Cyborg“ ist still und ängstlich. Es handelt sich um einen Mitarbeiter, der KI nutzt, um seine Kollegen im Verborgenen zu übertreffen, aber keinen Vorteil und keinen Anreiz darin sieht, diese Nutzung offenzulegen. Er fürchtet sich vor Urteilen oder davor, dass KI ihn ersetzen könnte. Was auch immer der Grund dafür sein mag, dass sie ihre KI-Nutzung geheim halten, es ist problematisch. Und es deutet darauf hin, dass das Unternehmen selbst noch nicht die richtige interne Beziehung zur KI aufgebaut hat. Das ist die Krankheit, für die diese Persönlichkeit symptomatisch ist.
Die Folgen sind gravierend. Es gibt Probleme wie den Datenabfluss über den Eingabeverlauf – wenn Sie ungesicherte, nicht für den Unternehmensgebrauch bestimmte Versionen von Tools verwenden, geben Sie möglicherweise sensible Informationen an Systeme weiter, die damit trainiert werden könnten, und diese Informationen könnten in Antworten an andere Nutzer auftauchen. Dies führt zu uneinheitlichen Ergebnissen zwischen den Teams. Das vielleicht kostspieligste Problem ist jedoch , dass dadurch Kompetenzlücken entstehen. Es mindert die Effizienz Ihrer Belegschaft und schafft eine wachsende Kluft zwischen Unternehmen, in denen diese „Secret Cyborgs“ weit verbreitet sind, und solchen Firmen, die offene, gut geregelte KI-Umgebungen aufgebaut haben, in denen Mitarbeiter ihre Tools ohne Repressalien nutzen können.
Die Lösung besteht darin, sicherzustellen, dass Sie Rahmenbedingungen dafür schaffen, wie – und nicht ob – Mitarbeiter KI nutzen, denn sie werden sie nutzen. Und man muss die Sichtweise von oben nach unten neu ausrichten: KI ist ein Beschleuniger für Facharbeit, kein Ersatz dafür. Ein Mitarbeiter, der durch KI unterstützt wird, leistet viel mehr als ein Mitarbeiter, der durch KI ersetzt wird. Die Unternehmen, die mit dem Gleichen mehr erreichen, anstatt mit weniger das Gleiche zu tun, werden wirklich die Gewinner sein.
Lillian Freiberg: Verstanden. Der heimliche Cyborg. Schweigsam und ängstlich. Ich sehe da eine ganz neue Zielgruppe für Therapien auf sie zukommen.
Austin Ritzel: In der Tat. Oder eine Science-Fiction-Serie.
Lillian Freiberg: Wir könnten es an Star Wars verkaufen.
Austin Ritzel: Das ist ein sehr trauriger „Star Wars“-Beitrag, aber ja.
„Ein durch KI unterstützter Mitarbeiter leistet viel mehr als ein durch KI ersetzter Mitarbeiter. Die Unternehmen, die mit denselben Ressourcen mehr erreichen, anstatt mit weniger dasselbe zu tun – sie werden wirklich die Gewinner sein.“
Teil 4: Selbst bauen oder kaufen – und was der „weiße Elefant“ tatsächlich kostet
Lillian Freiberg: Einige Unternehmen, die diese Entwicklung beobachten, sind zu einer Lösung gelangt, die auf den ersten Blick vernünftig klingt: „Wenn wir keinen geeigneten Anbieter finden, entwickeln wir es einfach selbst.“ Die Technologie selbst besitzen, die Roadmap kontrollieren, keine Abhängigkeit von einem externen Anbieter. Ich habe dieses Argument in vielen Vorstandsetagen überzeugend vorgebracht gehört. Aber die Umsetzung sieht ganz anders aus als die Präsentation. Wie beurteilen Sie diesen Kompromiss?
Austin Ritzel: Wenn wir über „Build versus Buy“ sprechen, müssen wir zwei Ebenen unterscheiden. Die erste sind die Grundmodelle: das, was Googles DeepMind in Gemini entwickelt, was Anthropic in Claude entwickelt und was OpenAI in ChatGPT entwickelt. Kaum ein Finanzinstitut zieht ernsthaft in Betracht, ein solches Grundmodell selbst zu entwickeln. Der Fachkräftemangel ist enorm, die damit verbundenen Investitionskosten sind enorm und die Rechenkapazitäten sind enorm. Aber die Entwicklung spezialisierter Tools und Anwendungen, die KI als zentrale Funktion nutzen – Datenextraktionsplattformen, Berichtsgeneratoren, Co-Piloten –, das ist ein interessanteres Thema, und genau hier liegen die wirklichen Abwägungen.
Mit den heutigen Tools könnte man theoretisch sein eigenes Gmail, sein eigenes Slack oder sein eigenes HubSpot entwickeln. Nur wenige tun das tatsächlich auf Unternehmensebene. Nicht, weil sie es technisch nicht könnten, sondern weil die Kosten dafür, das Ganze richtig hinzubekommen – und es dann auch richtig zu halten und zu warten –, jeden denkbaren Vorteil eines solchen Full-Stack-Lösung bei weitem übersteigen würden. Es wird zu einem verfluchten weißen Elefanten. Man hat diesen Elefanten gekauft und muss nun herausfinden, wie man ihn füttert und am Leben erhält.
Es gibt drei Gründe, warum der interne Weg oft hinter den Erwartungen zurückbleibt:
- Erstens entstehen dadurch eindeutig Opportunitätskosten. Jeder Ingenieur, der mit der Entwicklung eines internen KI-Tools betraut wird, ist ein Ingenieur, der nicht an den Kernkompetenzen der Einrichtung arbeitet.
- Zweitens gehen spezialisierte Tools mit Spezialisten einher: Experten, die sich ganz auf das jeweilige Problem konzentrieren und sich darin bestens auskennen. Bei Clarity AI haben wir ein Jahrzehnt damit verbracht, mithilfe eigens für diesen Zweck entwickelter Methoden einen riesigen Korpus an Nachhaltigkeitsdaten von Hunderten von Kunden zu sammeln, zu validieren, anzureichern und zu kuratieren. Dieses Fachwissen wächst mit der Zeit. Ein internes Team, das bei Null anfängt, wird es schwer haben, diese Tiefe zu erreichen.
- Drittens – und das ist etwas, worauf unser CTO großen Wert legt – ist die Wartung zwar unauffällig, aber enorm kostspielig. Wir halten über 400 metrische Methoden und 20 produktbezogene Methoden auf dem neuesten Stand, evaluieren und integrieren neue Modelle und unterstützen den Arbeitsablauf, wenn sich grundlegende Modelle ändern und regulatorische Rahmenbedingungen sich wandeln. Wir können diesen Aufwand auf Hunderte von Kunden verteilen. Ein internes Team muss diese Last allein tragen – und das auf Dauer.
„Nur wenige entwickeln heute alltägliche Tools auf Unternehmensebene. Nicht, weil sie technisch dazu nicht in der Lage wären, sondern weil die Kosten dafür, das Ganze richtig hinzubekommen – und es dann auch richtig zu halten und zu warten –, jeden denkbaren Vorteil, den der Besitz eines solchen Full-Stack mit sich bringen würde, bei weitem übersteigen würden.“
JP Morgan ist ein gutes Beispiel dafür. Das Unternehmen verfügt über mehr Kapital und mehr Ingenieure als viele Tech-Unternehmen. Jamie Dimon hat einmal gesagt: „Wir sind ein Tech-Unternehmen, das sich zufällig auch im Finanzbereich betätigt.“ Und dennoch geht JP Morgan auf der Modellebene eine Partnerschaft mit Anthropic ein und kauft auf der Workflow- und Tool-Ebene spezialisierte Anbieter auf. Man kauft den Kern und baut die Randbereiche auf.
Lillian Freiberg: Dahinter verbirgt sich auch die Frage der finanziellen Stabilität, die meiner Meinung nach von zu wenigen Unternehmen berücksichtigt wird. Keiner der großen Anbieter von Grundmodellen ist profitabel. Einige sind erheblich verschuldet. Was passiert mit all denjenigen, die auf diesen Modellen aufbauen, wenn einer von ihnen in ernsthafte Schwierigkeiten gerät? Ist das ein Risiko, das die Leute tatsächlich einkalkulieren?
Austin Ritzel: Das ist eine wirklich gute Frage. Und ich möchte klarstellen, dass Alphabet hier eine potenzielle Ausnahme darstellt: Alphabet ist enorm profitabel. Wenn man jedoch DeepMind, das interne Labor, das Gemini entwickelt, gesondert betrachtet, ist DeepMind selbst nicht profitabel. Auf Gesamtbasis sieht die Situation dort wahrscheinlich ähnlich aus wie bei Anthropic oder OpenAI.
Sich zu sehr auf ein einzelnes Modell festzulegen, ist ein Risiko, selbst wenn man finanzielle Bedenken einmal außer Acht lässt. Ich glaube, dass das ökonomische Modell auf der Seite der Schlussfolgerungen allmählich funktioniert. Aber das Training ist sehr kostspielig, und diese Bedenken sind durchaus berechtigt. Und keines dieser Grundlagenforschungslabore ist unverzichtbar.
Kürzlich gab es ein gutes Beispiel dafür: Elon Musk hat sein größtes Rechenzentrum außerhalb von Memphis, das „Colossus Data Center“, an Anthropic vermietet. Gleichzeitig verfügt Musk auch über Grok. Und es scheint, als habe er die Idee, Grok als führendes Modell zu etablieren, faktisch aufgegeben, indem er die gesamte Rechenkapazität an Anthropic vermietet hat. Unternehmen müssen widerstandsfähig gegenüber jeglichen externen Schocks sein, sei es eine Insolvenz oder einfach nur der Rückstand eines einzelnen Mitarbeiters.
Genau darin liegt die Bedeutung des Ansatzes der offenen Architektur. Es geht darum, eine Grundlage zu schaffen, die es ermöglicht, umzusteuern und neue Wege einzuschlagen, wenn jemand ins Hintertreffen gerät oder ganz aus dem Rennen fällt. Bei Clarity AI nutzt unsere Datenextraktionsplattform all die Modelle, die ich erwähnt habe – nicht nur, weil verschiedene Modelle für unterschiedliche Aufgaben besser geeignet sind, sondern auch, weil wir das Konzentrationsrisiko vermeiden wollen, das mit der Bindung an ein einziges Labor einhergeht.
„Der Vorteil des Ansatzes der offenen Architektur besteht darin, dass er eine Grundlage schafft, die es ermöglicht, umzudeuten und umzulenken, wenn jemand zurückfällt oder ganz aus dem Rennen ist.“
Es gibt da noch eine tiefgreifendere philosophische Frage, mit der ich mich beschäftigt habe. Reicht die Abhängigkeit, die wir in den letzten Jahren von den großen Stiftungslabors entwickelt haben, aus, um sie als „zu groß, um zu scheitern“ zu bezeichnen?
Lillian Freiberg: Ich sehe viele verschiedene Blickwinkel. Ich kann mir gut vorstellen, dass viele Menschen von beiden Seiten dafür argumentieren. Aber eines ist absolut sicher: Kein Finanzinstitut – kein Unternehmen – sollte sich in eine Lage begeben, in der es die Konsequenzen einer Antwort, die wie ein „Nein“ auf diese Frage klingt, am eigenen Leib zu spüren bekommt.
Teil 5: Wer gewinnt eigentlich?
Lillian Freiberg: Wenn wir über all das sprechen, insbesondere im Hinblick auf Finanzunternehmen, geht es um den Verlust von Wettbewerbsvorteilen und um entgangene Renditen. Das bringt mich zu dem, was meiner Meinung nach die Kernthese hinter dieser ganzen Diskussion ist: Wie wird sich dieser Markt tatsächlich entwickeln? Mein Bauchgefühl, basierend auf dem, was ich von Kunden und Vordenkern höre, ist, dass die spezialisierten Akteure, diejenigen mit echter Tiefe in einem bestimmten Bereich, die unabhängig vom bereits vom Kunden genehmigten Modell agieren können, am Ende die stärkste Position einnehmen werden. Sehen Sie das auch so?
Austin Ritzel: Ja. Und ich glaube, dass die wirtschaftlichen Gegebenheiten diese Entwicklung wohl zwangsläufig mit sich bringen. Die Basisschicht wird wahrscheinlich bis zu einem gewissen Grad zur Massenware. Sam Altman selbst hat den Endzustand von OpenAI mit einem Versorgungsunternehmen verglichen. Und als Folge dieser Kommerzialisierung der Basisschicht wird sich der differenzierte Mehrwert wahrscheinlich auf Schichten im Stack verlagern, die Dinge leisten können, die ein allgemeines Modell nicht kann.
Stellen Sie sich das LLM als Motor vor. Die Unternehmen, die sich von der Masse abheben, sind diejenigen, die ein Chassis darum herum aufbauen können: echte Fachkompetenz, kuratiertes Wissen und deterministische Methoden, die ein im Grunde probabilistisches Werkzeug transformieren. Zwei Personen, die dieselbe Frage stellen, müssen dieselbe Antwort erhalten. Sie brauchen Bewertungen. Sie brauchen Expertenprüfungen, bei denen Menschen im Regelkreis eingebunden sind. Diejenigen, die das Fahrgestell bauen können – die Lenkung, die Bremsen, die Karosserie – werden aus diesem Ökosystem einen ganz besonderen Mehrwert ziehen.
Auch die Verifizierungsinfrastruktur wird von grundlegender Bedeutung sein, insbesondere für Finanzinstitute oder andere Einrichtungen in regulierten Bereichen. Erklärbarkeit, Rückverfolgbarkeit bis hin zu einer kuratierten Datenbank sowie die Nachvollziehbarkeit der Verarbeitung – von den Rohdaten und der Methodik bis hin zum Endergebnis – machen diese Ergebnisse in regulierten Kontexten tatsächlich nutzbar.
„Stellen Sie sich das LLM als Motor vor. Die Unternehmen, die sich von der Masse abheben, sind diejenigen, die ein Chassis darum herum aufbauen können: echte Fachkompetenz, kuratiertes Wissen und deterministische Methoden, die ein im Grunde genommen probabilistisches Werkzeug transformieren.“
Lillian Freiberg: Auf jeden Fall. Und gerade für Kunden aus der Finanzbranche – Rückverfolgbarkeit, Vertrauen, IC- und Audit-Konformität – ist das von entscheidender Bedeutung. Wenn man all das berücksichtigt: Was unterscheidet eigentlich die spezialisierten Anbieter, die gestärkt aus dieser Situation hervorgehen, von denen, die den Wandel nicht überstehen?
Austin Ritzel: Ein paar Dinge. Architektonische Flexibilität, Modellunabhängigkeit. Echte Fachkenntnis: Eigene Daten einbringen, Methoden einbringen, um probabilistische Ergebnisse deterministisch zu machen. Daten werden in Zukunft ein echter Wettbewerbsvorteil sein.
Darüber hinaus werden spezialisierte Anbieter, die sich von der Masse abheben, auch eine wirklich robuste Infrastruktur für die Nachvollziehbarkeit verlangen. Nicht nur Seitenzahlen, sondern auch die Geometrie der Verweise: wo genau auf der Seite, die genaue Position der Informationen. Herkunftsnachweis. Nachprüfbare Transformationen: Wie gelangte man von den Rohdaten auf der Seite zu einem transformierten Ergebnis in einem automatisch generierten Bericht? Wie lässt sich der Verifizierungsaufwand – also die Zeit, die jemand benötigt, um zu bestätigen, dass die KI etwas Korrektes erzeugt hat – so weit wie möglich gegen Null reduzieren?
Die „Wrapper“ – also Unternehmen, die auf der Grundlage eines universellen Modells, dem jegliche Fachkenntnis fehlt, hübsche Benutzeroberflächen entwickeln – werden wahrscheinlich vom Markt verdrängt werden. Was euch von der Masse abhebt, sind kuratierte oder proprietäre Daten, überprüfbare und transparente Ergebnisse, die den Verifizierungsaufwand verringern, sowie die Fähigkeit, das zu leisten, was diese allgemeinen Modelle einfach nicht können.
Lillian Freiberg: Dünne Hüllen, die verschlungen werden. Ich glaube, das könnte der Spruch des Tages sein. Austin, vielen Dank. Das war wirklich fantastisch. Du hättest bei „Modellagnostizismus“ fast drei Mal hintereinander ins Schwarze getroffen, aber du hast es geschafft, dass alles Sinn ergibt, und das ist keine Kleinigkeit.
Austin Ritzel: Danke, Lillian.





