Abstraktes Kunstwerk aus bunten, durchscheinenden Bändern, die sich vor einem blaugrünen Hintergrund winden, mit blassen Kreisen am linken Rand.

Woraus KI-Systeme eigentlich bestehen: Die Architektur erklärt

Veröffentlicht: 20. April 2026

Geändert: 6. Mai 2026

Wichtigste Erkenntnisse

Moderne KI-Systeme bestehen aus vier unterschiedlichen Schichten – LLM, MCP, Skills und Agenten –, von denen jede ein anderes Problem löst. Wenn Unternehmen ein Tool kaufen, ohne zu verstehen, welche Schichten es abdeckt, landen sie am Ende mit beeindruckenden Demos und unzuverlässigen Produktionssystemen.
Zugriff und Intelligenz sind nicht dasselbe. Eine KI, die auf Ihre Daten zugreifen kann, benötigt dennoch Methodik und Fachwissen, um damit etwas Sinnvolles anzufangen.
Die großen KI-Forschungslabore haben sich auf dieselbe Architektur geeinigt. Die Terminologie unterscheidet sich zwar, doch die zugrunde liegenden Schichten sind einheitlich – was bedeutet, dass die Integrationen und Fähigkeiten, die Sie heute entwickeln, weniger wahrscheinlich an einen einzigen Anbieter gebunden sind.

Die Reihe zur KI-Architektur – Teil 2

Im ersten Teil dieser Reihe haben wir dargelegt, warum die Wahl der richtigen KI-Architektur entscheidend ist, insbesondere in regulierten Umgebungen, in denen sich eine falsche Entscheidung mit der Zeit immer stärker auswirkt. Dieses Mal befassen wir uns mit den Bausteinen selbst.

Moderne KI-Systeme sind nicht monolithisch aufgebaut. Sie bestehen aus verschiedenen Schichten, von denen jede eine andere Aufgabe erfüllt. Wenn man versteht, wozu die einzelnen Schichten dienen, fällt es viel leichter, Tools zu bewerten, die richtigen Fragen zu stellen und die Falle zu vermeiden, Funktionen statt Infrastruktur zu kaufen.

Die Beispiele in diesem Artikel sind bewusst einfach gehalten. Das Ziel besteht darin, zu zeigen, wie die Ebenen miteinander verbunden sind, und nicht darin, reale Arbeitsabläufe nachzubilden. Im nächsten Artikel werden wir uns damit befassen, wie diese Architektur in der Praxis speziell im Finanzdienstleistungsbereich aussieht.

8. April 2026

Warum die meisten KI-Präsentationen am Thema vorbeigehen

Ebene 1: Das LLM, die Schlussfolgerungs-Engine

Ein großes Sprachmodell (LLM) bildet das Herzstück der meisten modernen KI-Systeme. Es ist die Komponente, die Texte liest, schreibt, zusammenfasst, analysiert und Antworten generiert. Wenn von GPT-4, Claude oder Gemini die Rede ist, sind damit LLMs gemeint.

Stellen Sie sich das LLM als Gehirn vor. Es kann über ein enormes Spektrum an Themen und Formaten hinweg Schlussfolgerungen ziehen und Inhalte generieren, aber von sich aus kennt es weder Ihre internen Daten noch den spezifischen Kontext Ihres Unternehmens oder die Methodik, die Ihr Team anwendet. Es handelt sich um eine universelle Intelligenz: leistungsstark, aber noch ungeschliffen.

Die übrigen Ebenen dienen dazu, diese Intelligenz mit den richtigen Informationen zu verknüpfen und sie auf konkrete, konsistente Ergebnisse auszurichten.

Ebene 1 – Nur LLM

Das Modell weiß eine Menge

Aber nur das, was es während des Trainings gelernt hat. Keine Echtzeitdaten. Kein Unternehmenskontext. Keine Verbindung zur Außenwelt.

KI-Assistent

Wie ist das Wetter gerade in unserem Büro in New York?

Ich habe keinen Zugriff auf Wetterdaten in Echtzeit oder auf die Standorte Ihrer Niederlassungen. Generell kann das Wetter in New York im März von kalt bis mild reichen – typischerweise zwischen 1,7 und 12,8 °C.

Was fehlt noch?

Das Modell hat keine Möglichkeit, auf Informationen zuzugreifen, die über seine Trainingsdaten hinausgehen. Es kann keine Echtzeitinformationen abrufen, keine Abfragen an Ihre internen Systeme senden und nichts über Ihr Unternehmen wissen. Es handelt sich um eine allgemeine Intelligenz ohne Bezug zu Ihrer Welt.

Schicht 2: MCPs, die Verbindungsschicht

MCP steht für „Model Context Protocol“. Es handelt sich um einen offenen Standard, der festlegt, wie KI-Systeme mit externen Datenquellen und Tools verbunden werden. Ursprünglich von Anthropic eingeführt und mittlerweile branchenweit zunehmend verbreitet, ersetzt MCP ein Gewirr aus Einmal-Integrationen durch ein einheitliches Protokoll – ähnlich wie USB-C eine Schublade voller inkompatibler Kabel abgelöst hat.

In der Praxis stellt ein MCP-Server Funktionen (Abfragen einer Datenbank, Auslesen eines Dokumentenspeichers, Abrufen eines Live-Datenfeeds, Ausführen von Code) so bereit, dass KI-Systeme diese erkennen und einheitlich nutzen können. Anstatt für jedes Tool, auf das eine KI zugreifen muss, eine eigene Integration zu entwickeln, verbindet man sie über MCP, und jedes KI-System, das den Standard unterstützt, kann diese Funktionen nutzen.

Eines sollte besonders hervorgehoben werden: MCP regelt den Zugriff, nicht die Intelligenz. Es legt fest, worauf die KI zugreifen kann; was sie mit den gefundenen Informationen macht, bleibt weiterhin dem Modell und den darüberliegenden Schichten überlassen.

Ebene 2 – MCP

MCP bietet dem Modell eine einheitliche Möglichkeit, auf externe Ressourcen zuzugreifen

Live-Daten, APIs und interne Tools – ohne für jeden Anwendungsfall eine eigene Verbindung erstellen zu müssen.

KI-Assistent

Wie ist das Wetter gerade in unserem Büro in New York?

Unter der Haube

MCP

Wetterdienst – 30-Tage-Vorhersage

Im Moment sind es in New York 7 °C und es ist teilweise bewölkt. Perfektes Wetter für einen Mantel.

Was fehlt noch?

Das Modell kann nun auf externe Daten zugreifen – aber es hat keine Ahnung davon, wie Ihr Unternehmen funktioniert. Es kennt weder Ihr bevorzugtes Ausgabeformat noch die Methodik, die Ihr Team anwendet, noch das Fachwissen, das Ihre Analysen auszeichnet. Zugängliche Daten sind nicht gleichbedeutend mit nützlichen Daten.

Ebene 3: Kompetenzen, die Ebene des Know-hows

Während MCP die Frage „Worauf kann die KI zugreifen?“ beantwortet , beantworten Skills die Frage „Wie soll die KI diese bestimmte Aufgabe ausführen?“

Ein „Skill“ ist ein wiederverwendbares, portables Paket, das einen bestimmten Arbeitsablauf, eine bestimmte Methodik oder Fachwissen in einem bestimmten Bereich kodiert. Er kann Anweisungen, Beispiele, Vorlagen und strukturierte Logik zu einer Einheit bündeln, die ein KI-System laden und konsistent anwenden kann. Und genau wie MCP sind Skills als offener Standard konzipiert – das bedeutet, dass ein gut konzipierter Skill über verschiedene KI-Systeme hinweg, die die Spezifikation unterstützen, geteilt und wiederverwendet werden kann, ohne an eine bestimmte Plattform gebunden zu sein.

Eine gute Metapher stammt aus „Matrix“: Als Neo Kung-Fu lernen muss, erwirbt er dieses Wissen nicht durch jahrelanges Üben, sondern es wird ihm „installiert“. Ähnlich verhält es sich mit Fähigkeiten. Sie verleihen einem KI-System eine wiederverwendbare Fähigkeit, die Fachwissen in einer Form kodiert, die es sofort und konsistent anwenden kann.

Besonders wirkungsvoll ist dies in Organisationen, die „eine bestimmte Vorgehensweise“ haben. So folgen beispielsweise Analystenberichte in der Finanzbranche einer bestimmten Struktur. Compliance-Mitteilungen unterliegen strengen Anforderungen hinsichtlich Format und Tonfall. Beschaffungsentscheidungen folgen einer vordefinierten Genehmigungsmethodik.

Ohne Skills müsste man diese Anforderungen jedes Mal neu erklären, wenn man eine Aufgabe ausführt. Mit Skills wird die Methodik einmalig festgeschrieben und einheitlich angewendet, unabhängig davon, wer sie ausführt oder welches zugrunde liegende Modell dahintersteckt.

Praktisch gesehen ist eine Fertigkeit nichts anderes als ein strukturiertes Dokumentenpaket: Anweisungen, Beispiele, Vorlagen und Referenzmaterial, das das Modell liest und befolgt – ähnlich wie die Methodikleitfäden oder Standardarbeitsanweisungen, die Ihr Team bereits pflegt. Der Unterschied besteht darin, dass es so formatiert ist, dass ein KI-System es konsistent und automatisch anwenden kann, anstatt darauf angewiesen zu sein, dass sich jemand an die richtigen Schritte erinnert.

Nicht jedes Unternehmen ist bereit, vom ersten Tag an vollwertige Skills zu entwickeln. Die meisten großen Plattformen bieten eine vereinfachte Version dieses Konzepts in Form von Projekten an : eine Möglichkeit, Kontext, Anweisungen und Dateien über verschiedene Konversationen hinweg zu organisieren und zu speichern, sodass das Modell Ihre Präferenzen und Ihr Wissen weitergibt, ohne jedes Mal neu eingewiesen werden zu müssen. Projekte sind zwar weniger leistungsfähig und übertragbar als ein Skill, aber sie sind ein praktischer Ausgangspunkt für Teams, die Konsistenz wünschen, ohne den Aufwand, der mit der Erstellung und Verteilung von Skills im gesamten Unternehmen verbunden ist.

Der entscheidende Unterschied: MCP = Zugang. Fähigkeiten = Methode.

Ebene 3 – Kompetenzen

Die Fähigkeit sagt dem Modell, was es wissen muss. Der MCP sagt ihm, wo es suchen muss.

Gemeinsam lässt sich eine Frage, die das Modell allein nicht hätte beantworten können, präzise und strukturiert beantworten.

KI-Assistent

Wie ist das Wetter heute in unseren einzelnen Büros?

Unter der Haube

Fähigkeit

Unternehmensniederlassungen – 5 Standorte

MCP

Wetterdienst – 30-Tage-Vorhersage

Hier ist das Wetter an allen Standorten:

New York 7 °C, teilweise bewölkt

Singapur 31 °C, feucht

London 12 °C Bewölkt

Madrid 16 °C Klar

São Paulo 24 °C Regenschauer

Was fehlt noch?

Das Modell kann zwar auf die richtigen Daten zugreifen und Ihre Methodik anwenden – doch komplexe, mehrstufige Arbeitsabläufe erfordern nach wie vor jemanden, der die einzelnen Schritte manuell koordiniert. Je mehr Schritte eine Aufgabe umfasst, desto mehr menschlicher Aufwand ist erforderlich, um sie miteinander zu verknüpfen.

Ebene 4: Agenten, die Koordinationsschicht

Ein Agent ist ein System, das ein LLM mit Werkzeugen, Anweisungen und Logik kombiniert, um mehrstufige Aufgaben mit einem gewissen Maß an Autonomie auszuführen. Während ein einfacher Assistent lediglich eine Frage beantwortet und es dabei belässt, plant ein Agent, ruft Informationen ab, führt Aufgaben aus, überprüft seine eigenen Ergebnisse und passt sich an, wenn etwas nicht wie erwartet verläuft.

Wenn man das LLM als Gehirn betrachtet, das MCP als das Bindegewebe, das es mit der Welt verbindet, und die Fähigkeiten als die erlernten Fertigkeiten, auf die es zurückgreifen kann, dann ist der Agent der Operator, der alles zusammenführt, um tatsächlich etwas zu bewirken.

Hier wird aus dem „KI-Assistenten“ ein „KI-System“. Ein Assistent gibt lediglich Antworten auf der Grundlage seines festgelegten Wissens. Ein Agent hingegen kann Informationen erschließen und eigenständig handeln.

Schicht 4 – Agent

Agenten planen, entscheiden und führen aus

Der LLM liefert die Gründe, die MCPs stellen die Verbindungen her, die Fähigkeiten sorgen für die Methode, und der Agent koordiniert all dies, um ein Ergebnis zu erzielen.

KI-Assistent

Welche Wochen im nächsten Monat eignen sich am besten für einen Besuch in unseren einzelnen Niederlassungen?

Unter der Haube

Fähigkeit

Firmenstandorte – 5 Standorte gefunden

MCP

Wetterdienst – 30-Tage-Vorhersage

Agent

Die besten Reisezeiten ermittelt

MCP

Kalender – Freie Wochen gefunden

Agent

Wochenplan steht

Die besten Monate für einen Besuch in den Büros sind die folgenden:

7.–11. April New York – São Paulo

14.–18. April London – Madrid

22.–24. April Singapur

Für alle vier Schichten gilt ein Grundsatz: Jede Schicht löst ein anderes Problem. Das LLM sorgt für die logische Verarbeitung. Das MCP sorgt für den Zugriff. Die Skills sorgen für die Methodik. Die Agenten sorgen für die Koordination. Ein System, das in einer Schicht stark, in einer anderen jedoch schwach ist, wird seine Schwachstellen im Produktionsbetrieb schnell offenbaren: beeindruckend in der Demo, unzuverlässig im großen Maßstab.

Wie die großen KI-Forschungslabore diese Schichten umsetzen

Die führenden KI-Forschungslabore haben sich auf bemerkenswert ähnliche Architekturen geeinigt, obwohl sie das Problem von unterschiedlichen Ausgangspunkten aus angegangen sind.

Das deutlichste Zeichen für diese Konvergenz ist MCP selbst. Was als Open-Source-Protokoll von Anthropic begann, wurde mittlerweile von allen großen Plattformen übernommen. OpenAI, Google und Microsoft unterstützen MCP, wodurch es zum gemeinsamen Standard für die Anbindung von KI-Systemen an externe Tools und Daten geworden ist. Für Unternehmen, die Integrationen entwickeln, bedeutet dies, dass die Verbindungen, in die sie heute investieren, weitaus seltener an einen einzigen Anbieter gebunden sind.

Über die Verbindungsschicht hinaus gestaltet jedes Labor den Stack auf seine eigene Weise:

Anthropic hat bei der Einführung von Skills dieselbe Philosophie der „offenen Standards“ angewandt – eine plattformübergreifende Methode, um Methodik und Fachwissen zu kodieren. Claudes Plugins bündeln MCP-Verbindungen und Skills in installierbaren Paketen, sodass einem KI-System in einem einzigen Schritt sowohl Zugriff als auch Know-how bereitgestellt werden können.
OpenAI hat sein Ökosystem von Anbindungen unter dem Dach von „Apps“ aufgebaut, wodurch ChatGPT Zugriff auf externe Tools und Datenquellen erhält.
Microsoft hat Copilot Studio zu seiner Plattform für die Entwicklung von Agenten gemacht, mit MCP-basierten Konnektoren und einer neuen „Notebooks“-Funktion für einen dauerhaften Projektkontext.
Google unterstützt MCP auf allen seinen Entwickler- und Cloud-Plattformen und hat kürzlich „Projects“ eingeführt, um Kontexte und Anweisungen über verschiedene Konversationen hinweg zu speichern.

Die Terminologie unterscheidet sich je nach Plattform, doch die zugrunde liegenden Konzepte entsprechen denselben Ebenen:

DIE SERIE ZUR KI-ARCHITEKTUR – TEIL 2

Wie die großen KI-Forschungslabore die vier Schichten umsetzen

Dieselbe Architektur, vier verschiedene Vokabulare

	Anthropic	OpenAI	Microsoft	Google
Haupt-GenAI-App	Claude	ChatGPT	Copilot	Zwillinge
Persistenter Kontext	Projekte	Projekte	Notizbücher	Projekte
Verbindungsschicht	Steckverbinder	Apps	Steckverbinder	Erweiterungen; MCP (nur dev/cloud)
Funktionen des Agenten	Claude Cowork	Agentenmodus	Copilot Studio	Gemini-Agent

Für alle, die KI-gestützte Arbeitsabläufe im Finanzdienstleistungssektor entwickeln, ist diese Konvergenz eine gute Nachricht – doch die Frage der Governance bleibt damit nicht geklärt. Wie die einzelnen Plattformen mit Datenverbindungen, Methodik und mehrstufiger Koordination umgehen, entscheidet darüber, ob das System, das Sie heute entwickeln, einer genauen Prüfung morgen standhalten wird.

Was kommt als Nächstes: Agenten, die handeln, und Agenten, die zusammenarbeiten

Viele der Tools, die Menschen bereits nutzen, verfügen über Agenten, die im Hintergrund laufen. Wenn ChatGPT in einer einzigen Sitzung Code schreibt, das Internet durchsucht und eine Antwort zusammenstellt, ist das ein Agent bei der Arbeit. Das Gleiche gilt für Claude, Microsoft Copilot und eine wachsende Zahl von Unternehmensprodukten. Doch derzeit arbeiten diese Agenten noch innerhalb der Grenzen eines Chatfensters und einer Reihe vordefinierter Tool-Verbindungen. Das beginnt sich nun zu ändern.

Die erste Herausforderung sind Agenten, die in Ihrem Namen eine vollständige Computerumgebung bedienen können – surfen, klicken, zwischen Anwendungen navigieren –, anstatt sich auf den Chat zu beschränken. Anthropics „Cowork“ und OpenAIs „Agent-Modus“ geben der KI einen eigenen, isolierten Arbeitsbereich, in dem sie Aufgaben mit allen verfügbaren Tools ausführen kann, während Open-Source-Projekte wie OpenClaw einen anderen Ansatz verfolgen und einen KI-Agenten direkt auf Ihrem lokalen Rechner laufen lassen, mit Zugriff auf Ihren Browser, Ihre Dateien und Ihre Messaging-Apps.

Die zweite Herausforderung sind Agenten, die sich untereinander abstimmen. Wenn man heute möchte, dass ein KI-System eine Aufgabe weitergibt – beispielsweise von einem Forschungsagenten an einen Compliance-Prüfungsagenten, der auf einer anderen Plattform basiert –, muss dies manuell eingerichtet werden. Das A2A-Protokoll von Google soll dies ändern und den Agenten eine gemeinsame Sprache für die plattform- und herstellerübergreifende Delegierung von Aufgaben bieten.

Beide Entwicklungsbereiche folgen dem gleichen Muster: mehr Autonomie, breiterer Zugang, höhere Risiken. Ein Agent, der in Ihrem Namen im Internet surfen und Anwendungen bedienen kann, ist weitaus leistungsfähiger als einer, der auf ein Chat-Fenster beschränkt ist, birgt aber auch größere Risiken. Die Branche arbeitet noch daran, diese Systeme so sicher, überprüfbar und kontrollierbar zu gestalten, dass sie für regulierte Umgebungen geeignet sind. Für Teams im Finanzdienstleistungsbereich ist dies ein Bereich, den es genau zu beobachten gilt, an den man sich jedoch mit Vorsicht heranwagen sollte.

In der nächsten Folge dieser Reihe werden wir zeigen, wie diese vier Ebenen in der Praxis bei Arbeitsabläufen im Finanzdienstleistungsbereich aussehen, wobei jede Ebene spezifische, nachvollziehbare Aufgaben übernimmt.

Folgen Sie uns auf LinkedIn oder abonnieren Sie unseren Newsletter, damit Sie nichts verpassen.

Bleiben Sie auf dem Laufenden

Erhalten Sie Marktinformationen von unseren Experten direkt in Ihren Posteingang.

Informationen zum Autor

Yago González

Leitender Produktmanager, GenAI-Initiativen, Clarity AI

Yago González leitet die Strategie hinter den generativen KI-Funktionen Clarity AI . Zuvor leistete er Pionierarbeit bei der Integration generativer KI bei Iberia, der spanischen Fluggesellschaft, die zur International Airlines Group gehört.

Forschung und Einblicke

Aktuelle Nachrichten und Artikel

Einhaltung von Vorschriften

Die Verordnung über nachhaltige Finanzdienstleistungen im Jahr 2026: Fragmentierung, Datenlücken und die neue Realität für Anleger

Begeben wir uns in eine neue Ära pragmatischer Komplexität oder verlieren wir einfach den Faden der Nachhaltigkeitsagenda? Mit dieser Frage leitete Lorenzo Saa, Chief Sustainability Officer bei Clarity AI, kürzlich ein Gespräch mit Patricia Pina, Chief Research Officer Clarity AI, und Cornelius Müller, Policy Officer bei der Sustainable Banking Coalition, ein. Die Gruppe diskutierte über…

Artikel lesen

Klima

Das Toolkit für Klimarisiken: Szenarien, Modelle und wie man es richtig macht

Die Offenlegung von Klimarisiken hat sich von einem Alleinstellungsmerkmal zu einem Standard entwickelt, und die Erwartungen steigen stetig. Institutionelle Anleger müssen nun klimabezogene Risiken unter Berücksichtigung verschiedener Erwärmungsszenarien offenlegen und steuern. Die Herausforderung besteht darin, wie dies zu bewerkstelligen ist: Erfahren Sie gemeinsam mit uns, wie Finanzinstitute Klimarisiken mithilfe von Szenarioanalysen, zukunftsorientierten Kennzahlen und KI-gesteuerten Arbeitsabläufen in die Praxis umsetzen. Anhand von Fallbeispielen…

Artikel lesen

Wie der Einsatz von KI in der Finanzbranche wirklich aussieht: Ein Gespräch an der NYSE

Lillian Freiberg Clarity AI ist zu Gast bei FintechTV an der NYSE, um über den Einsatz von KI, die Ausführung von Mandaten und intelligentere Investitionsabläufe zu sprechen.

Artikel lesen

Sprechen Sie mit einem Experten

Woraus KI-Systeme eigentlich bestehen: Die Architektur erklärt

Die Reihe zur KI-Architektur – Teil 2

Warum die meisten KI-Präsentationen am Thema vorbeigehen

Ebene 1: Das LLM, die Schlussfolgerungs-Engine

Schicht 2: MCPs, die Verbindungsschicht

Ebene 3: Kompetenzen, die Ebene des Know-hows

Ebene 4: Agenten, die Koordinationsschicht

Wie die großen KI-Forschungslabore diese Schichten umsetzen

Wie die großen KI-Forschungslabore die vier Schichten umsetzen

Was kommt als Nächstes: Agenten, die handeln, und Agenten, die zusammenarbeiten

Bleiben Sie auf dem Laufenden

Informationen zum Autor

Forschung und Einblicke

Die Verordnung über nachhaltige Finanzdienstleistungen im Jahr 2026: Fragmentierung, Datenlücken und die neue Realität für Anleger

Das Toolkit für Klimarisiken: Szenarien, Modelle und wie man es richtig macht

Wie der Einsatz von KI in der Finanzbranche wirklich aussieht: Ein Gespräch an der NYSE

Download der Ressource