Übersicht mit KI

Die EQS Group GmbH und der Berufsverband der Compliance Manager e.V. haben die Leistungsfähigkeit von KI im Bereich Compliance untersucht. Der EQS AI Benchmark testete sechs große Sprachmodelle in 120 praxisnahen Anwendungen. Ergebnisse zeigten, dass KI-Modelle bei strukturierten Aufgaben verlässlich arbeiten, jedoch bei offenen Aufgaben und Bewertungen Schwächen aufweisen. Google Gemini 2.5 Pro erzielte die beste Gesamtleistung. Die Studie unterstreicht Fortschritte und Grenzen der KI für Compliance-Teams: Während sie strukturierte Aufgaben präzise lösen können, bleibt menschliche Kontrolle unerlässlich. Insbesondere die Formulierung von Aufgabenstellungen beeinflusst die Ergebnisse erheblich. Der Bericht bietet Einblicke zur realistischen Einschätzung von KI in Compliance-Prozessen.

placeholder

EQS Group sieht Fortschritte bei KI-Leistung

KI-Modelle für Compliance-Aufgaben verglichen

21. Oktober 2025

00:00

Sorry, no results.

Please try another keyword

Die EQS Group GmbH hat gemeinsam mit dem Berufsverband der Compliance Manager e.V. (BCM) die Leistungsfähigkeit von künstlicher Intelligenz im Bereich Compliance untersucht. Der veröffentlichte EQS AI Benchmark testete sechs große Sprachmodelle in 120 praxisnahen Anwendungen, darunter Risikoanalysen, Bewertungen von Interessenkonflikten und Third-Party-Screenings. Ziel war es, zu prüfen, inwieweit KI-Systeme den Anforderungen des Arbeitsalltags von Compliance-Fachleuten entsprechen. Bei strukturierten Aufgaben erzielten die getesteten Modelle laut EQS Group besonders hohe Genauigkeiten, während die Ergebnisse bei offenen oder mehrdeutigen Aufgaben deutlich uneinheitlicher waren.

%C2%A9nateejindakum AdobeStock 1535598481 — Bild: ©nateejindakum/stock.adobe.com

Leistungsunterschiede und Fortschritte

Nach den Ergebnissen erreichen KI-Modelle bei eindeutig definierten Entscheidungsaufgaben durchschnittlich eine Genauigkeit von 90,8 Prozent und beim Datenabgleich von 91,8 Prozent. Vier der sechs Systeme lagen dabei über 95 Prozent. Bei komplexeren Analysen ergaben sich größere Unterschiede: Zwischen dem besten und dem schwächsten Modell betrug die Differenz 60 Prozentpunkte. Das Modell Gemini 2.5 Pro von Google erzielte den besten Wert mit 88 Prozent, während GPT-5 von OpenAI auf 62 Prozent und GPT-4o auf 28 Prozent kam. Im Gesamtranking belegte Gemini 2.5 Pro mit 86,7 Prozent knapp den ersten Platz vor GPT-5 mit 86,5 Prozent. GPT-5 zeigte laut EQS besondere Stärken bei kreativen Textaufgaben, während Gemini bei analytischen Aufgaben vorne lag. OpenAI o3 erreichte 83,3 Prozent, Claude Opus 4.1 von Anthropic 81,5 Prozent, GPT-4o 72,9 Prozent und Mistral Large 2 70,1 Prozent. Die Ergebnisse zeigen laut EQS Group den technischen Fortschritt zwischen 2024 und 2025.

Anwendungsmöglichkeiten und Grenzen

Die Analyse macht deutlich, dass die aktuellen KI-Modelle bei strukturierten Aufgaben verlässlich arbeiten, bei offenen Aufgaben oder Bewertungen jedoch Grenzen haben. Offene Aufgaben, etwa Management-Briefings oder Berichte zu internen Untersuchungen, wurden zusätzlich durch Fachjurys geprüft. GPT-5 erreichte in dieser Kategorie 67,4 Prozent. Die Ergebnisse unterstützen nach Angaben von EQS eine realistische Einschätzung des aktuellen Reifegrads von KI in Compliance-Prozessen.

Konsistenz und Fehlerraten

Der Bericht prüfte auch, wie verlässlich die geprüften Modelle in sich sind. Bei mehrfach wiederholten Multiple-Choice-Aufgaben gaben die Systeme in über 95 Prozent der Fälle dieselbe Antwort. Halluzinationen, also sachlich falsche Angaben, traten in drei Fällen auf und entsprechen einer Rate von 0,71 Prozent. Die EQS Group bewertet das als Zeichen dafür, dass KI-Modelle bei klar definierten Aufgaben stabile und überprüfbare Ergebnisse liefern können. Da Fehler nicht ausgeschlossen sind, bleibt eine menschliche Kontrolle insbesondere bei sensiblen Inhalten oder regulatorischen Sachverhalten notwendig.

Prompt-Design und Modellwahl

In der Studie wurde außerdem untersucht, wie stark die Qualität der Ergebnisse von der Formulierung der Aufgabenstellung abhängt. Je präziser die Fragestellung – etwa bei Screening-Daten oder der Gewichtung von Vorwürfen – formuliert wurde, desto besser fielen die Resultate aus. Insbesondere GPT-5 und Gemini 2.5 Pro setzten laut EQS komplexe Anweisungen zuverlässig um, was als Vorteil für Compliance-Teams gilt, die mit umfangreichen Daten und differenzierten Regelwerken arbeiten.

Methodik und Aufbau der Untersuchung

Für den EQS AI Benchmark Report wurden die Modelle OpenAI GPT-5, GPT-4o und o3 sowie Google Gemini 2.5 Pro, Anthropic Claude Opus 4.1 und Mistral Large 2 geprüft. Testgrundlage waren 120 Aufgaben aus zehn Kernbereichen der Compliance, darunter Risikoanalysen, Whistleblowing-Auswertungen, Trainings-Evaluationen und regulatorische Analysen. Die Aufgaben wurden unter Mitwirkung von Compliance-Praktikerinnen und -Praktikern entwickelt und teilweise auf realen oder synthetischen Daten aufgebaut, etwa aus Personal- oder Trainingsinformationen und Policy-Texten. Offene Aufgaben wurden in Zusammenarbeit mit dem BCM durch Fachjurys bewertet.

Bedeutung für Praxis und Umsetzung

Nach Angaben der EQS Group liefert der Benchmark einen Einblick in den Stand der KI-Entwicklung im Compliance-Umfeld und soll Organisationen helfen, den Nutzen und die Grenzen von KI realistisch einzuordnen. Die Studie zeigt sowohl den technologischen Fortschritt als auch die bestehenden Einschränkungen bei komplexen Aufgaben. Sie verdeutlicht, dass KI menschliche Entscheidungen und Verantwortung im Compliance-Management nicht ersetzt, sondern ergänzen kann.

Thematik: Märkte und Trends, News

EQS Group GmbH

Zur Firmenwebsite

News

Bild: ©metamorworks/stock.adobe.com

Cybersicherheit

All for One Group beteiligt sich an BrightFlare

Die All for One Group, ein IT-, Consulting- und Service-Provider aus Filderstadt, beteiligt sich an dem österreichischen Cybersecurity-Spezialisten BrightFlare.

Weiterlesen: All for One Group beteiligt sich an BrightFlare
Bild: Heitec AG/ A+K

Intralogistik-Portfolio erweitert

Heitec übernimmt Artschwager + Kohl

Artschwager + Kohl Software ist seit Januar 2026 Teil der Heitec-Gruppe.

Weiterlesen: Heitec übernimmt Artschwager + Kohl
Bild: ©enzozo/stock.adobe.com

Google-Report zur Münchner Sicherheitskonferenz

Wenn KI-Modelle zum Angriffsziel werden

Zur Münchner Sicherheitskonferenz (13. bis 15. Februar) hat die Google Threat Intelligence Group (GTIG) einen Bericht veröffentlicht, mit dem die Verfasser die Debatte um KI-gestützte Bedrohungen auf eine operative Ebene ziehen.

Weiterlesen: Wenn KI-Modelle zum Angriffsziel werden
Bild: Hiscox Europe Underwriting Limited

Hiscox-Umfrage von Statista:

Mehr IT-Dienstleister erleben Vorwürfe wegen Schlechtleistung

Gegen zwei Drittel der IT-Dienstleister wurden im vergangenen Jahr seitens ihrer Auftraggeber Vorwürfe wegen angeblicher Schlechtleistung erhoben.

Weiterlesen: Mehr IT-Dienstleister erleben Vorwürfe wegen Schlechtleistung
Bild: ForeScout Technologies, Inc.

Dirk Decker übernimmt

Forescout ernennt Regional Director für Zentraleuropa

Forescout Technologies, ein Spezialist für Cybersicherheit, hat die Ernennung von Dirk Decker (Bild) zum Regional Director für Zentraleuropa bekanntgegeben.

Weiterlesen: Forescout ernennt Regional Director für Zentraleuropa
Bild: ©Kamran-Studio/stock.adobe.com

IBM X-Force Threat Index

KI hilft Angreifern, Schwachstellen schneller auszunutzen

In einem aktuellen Bericht weist IBM darauf hin, dass Cyberkriminelle grundlegende Sicherheitslücken in dramatisch höherem Maße ausnutzen.

Weiterlesen: KI hilft Angreifern, Schwachstellen schneller auszunutzen
Bild: Dragons, Inc.

Operative Störungen statt passive Erkundung

Wie Angreifer industrielle Steuerungssysteme ins Visier nehmen

Dragos, Cybersicherheitsspezialist für OT-Umgebungen, analysiert in einem Bericht aktuelle Cyberbedrohungen für industrielle und kritische Infrastrukturen.

Weiterlesen: Wie Angreifer industrielle Steuerungssysteme ins Visier nehmen
Bild: Neura Robotics

Gemeinsames Projekt der TU München und Neura Robotics

Ein Lernzentrum für Roboter entsteht

Das Munich Institute of Robotics and Machine Intelligence (MIRMI) der Technischen Universität München (TUM) und das Unternehmen Neura Robotics planen ein Forschungs- und Trainingszentrum für Robotik im wissenschaftlichen Bereich.

Weiterlesen: Ein Lernzentrum für Roboter entsteht
Bild: ©Nassorn/stock.adobe.com

Neues Gremium

Deutsche Gesellschaft für Robotik gegründet

Mit der Deutschen Gesellschaft für Robotik e.V. hat sich im März 2026 eine neue gemeinnützige Fachgesellschaft gegründet, die die Förderung von Wissenschaft, Forschung und Bildung im Bereich der Robotik zum Ziel hat.

Weiterlesen: Deutsche Gesellschaft für Robotik gegründet
Bild: ©greenbutterfly/stock.adobe.com

Was ist eigentlich was?

Ein kurzer Blick auf CRA, EU-Maschinenverordnung und NIS-2

Gezielte Cyberangriffe auf Anlagen und Maschinen sind längst Realität. Mit CRA, NIS2 und der neuen EU-Maschinenverordnung reagiert der Gesetzgeber nicht nur mit klaren Empfehlungen, sondern auch mit konkreten Meldepflichten, Vorgaben und Sanktionen. NTT Data fasst zusammen, was hinter den drei Vorgaben steckt und welche Auswirkungen sie haben.

Weiterlesen: Ein kurzer Blick auf CRA, EU-Maschinenverordnung und NIS-2

Reihe Wissen Kompakt

ERP

Ein Unternehmen, das sich mit der Auswahl eines ERP- Systems befasst, muss sich gleichsam mit einem viel- schichtigen Software-Markt und unklaren Interessen- lagen an interne Abwick- lungsprozesse auseinander- setzen. Guter Rat bei der Investitionsentscheidung ist teuer. ERP Wissen Kompakt unterstützt Sie bei der gezielten Investition in die IT-Infrastruktur.
KI Künstliche Intelligenz

Immer mehr Anbieter von Maschinen, Automatisierungstechnik und Industriesoftware integrieren künstliche Intelligenz in ihre Produkte. Das ganze Potenzial spielen selbstlernende Systeme aber erst aus, wenn sie passgenau auf ihren Einsatz in Fertigung und Büro zugeschnitten wurden. Über beide Möglichkeiten, als Fertiger die Vorzüge von industrieller KI zu nutzen, geht es im regelmäßig aktualisierten Themenheft Künstliche Intelligenz.
IIoT Industrial Internet of Things

Das Internet of Things verändert Produktwelten und die Vernetzung in der Fertigung gleichermaßen. Entstehende Ökosysteme laden zur einer neuen Form der Zusammenarbeit ein. Die Spezialausgabe IoT Wissen Kompakt informiert über die Technologie, Projektierung und Anbieter für die eigene Applikation, in- und außerhalb der Fabrik.
MES Manufacturing Execution Systems

Um alle Potenziale eines MES umfassend ausnutzen zu können, beleuchten unsere Autoren in der Serie von MES Wissen Kompakt die erfolgskritischen Faktoren, um Fertigungsunternehmen präventiv zu steuern. Darüber hinaus präsentiert MES Wissen Kompakt ein breites Spektrum an Firmenportraits, Produkt- neuheiten und Dienst- leistungen im MES-Umfeld.

Partner-Netzwerke

CtrlX-Partner

Hersteller von Automatisierungstechnik fügen eigene und von Partnern beigesteuerte IT- und Automatisierungskomponenten zunehmend zu Ökosystemen zusammen. CtrlX Automation von Bosch Rexroth ist mit über 100 Partnern eines der größten an Markt. Mit dem Portfolio lassen sich Automatisierungssysteme modular zusammenstellen und in die IT-Schicht integrieren.
Microsoft-Partner

Mittelständische Unternehmen investieren selbst in schwierigen Zeiten in Microsoft-Technologien, weil sie überzeugt sind, dass ihre Mitarbeiterproduktivität steigt und sich ihre Kostenstruktur bessert. Microsoft hat mit dem Microsoft-Partner-Network ein Netzwerk aufgebaut, das ein Forum für den Aufbau von Partnerschaften, Zugang zu Ressourcen und einen Rahmen für Dialoge und Kooperationen bietet.
SAP-Partner

Auf der Suche nach Innovation, nach neuen Lösungen und der Abgrenzung zum Mitbewerb vernetzen sich zunehmend mehr Unternehmen mit externen Experten und Partnern. SAP hat mit dem SAP-Ecosystem ein Netzwerk aufgebaut, das ein Forum für den Aufbau von Partnerschaften, Zugang zu Ressourcen und einen Rahmen für Dialoge und Kooperationen bietet.