Risikoreiche KI per Red Teaming testen

3. Mai 2024

Red Teaming ist eine Möglichkeit, um etwa die Sicherheit von künstlicher Intelligenz zu testen. Jedoch gibt es hierfür keine standardisierten Ansätze. Wissenschaftler des ZEW in Mannheim haben dafür einen Vorschlag.

Die KI-Verordnung der EU sieht vor, dass Künstliche-Intelligenz-Modelle (KI) „für allgemeine Zwecke mit systemischem Risiko“ besonders strikt überprüft werden. In diese Modellkategorie gehören auch populäre generative KI-Modelle wie GPT4 von OpenAI. Forschende vom ZEW Mannheim schlagen nun Rahmenbedingungen vor, wie die Prüfungen solcher Modelle systematisch durchgeführt werden sollten. Der Vorschlag basiert auf einem Forschungsprojekt, das von der Baden-Württemberg Stiftung gefördert wurde.

„Die Prüfung generativer KI mit systemischen Risiken benötigt klar definierte Ziele, abgegrenzte Rollen sowie Anreiz- und Koordinierungssysteme für alle Beteiligten. Nur so sind verlässliche Prüfergebnisse zu erwarten – und diese sollten in standardisierter Form veröffentlicht werden. Um Interessenkonflikte zu vermeiden, sollte die Prüfung durch unabhängige Dritte durchgeführt werden. Als externe Dienstleistung kann so ein spezialisierter Markt für KI-Sicherheitstests entstehen“, fasst Dr. Dominik Rehse, Ko-Autor des Vorschlags und Leiter der ZEW-Nachwuchsforschungsgruppe ’Design digitaler Märkte’, zusammen.

KI-Verordnung sieht Adversarial Testing vor

Die KI-Verordnung sieht vor, dass betreffende KI-Modelle durch sogenanntes Adversarial Testing systematisch auf Schwachstellen geprüft werden. Dabei handelt es sich um Stresstests, die darauf ausgelegt sind, die KI-Modelle durch wiederholte Interaktion zu unerwünschtem Verhalten zu provozieren.

Allerdings sei das Adversarial Testing in der KI-Verordnung nicht genauer geregelt, so Rehse. „Die Vorgabe verweist lediglich auf Verhaltenskodizes und harmonisierte Standards, die nun entwickelt werden. Es gilt, diese Kodizes und Standards so zu gestalten, dass sie zu einer effizienten und effektiven Prüfung führen.“

Per Red Teaming testen

Hierfür eignet sich aus Sicht der ZEW-Wissenschaftler insbesondere das sogenannte Red Teaming. Diese umfassendere Form des geforderten Adversarial Testing bezieht zusätzlich verschiedene Arten von Angriffen auf das Modell selbst ein.

„Internes Red Teaming wird zwar nach eigenem Bekunden von den meisten großen KI-Entwicklungshäusern bereits durchgeführt, allerdings gibt es dafür keine standardisierten Ansätze, auch nicht für KI-Modelle desselben Typs. Dadurch wird der Vergleich der Ergebnisse unnötig erschwert. Vor allem fehlt bei den derzeitigen Versuchen meist ein klar definiertes Ziel, sodass unklar ist, ob und wann ein Modell ausreichend getestet wurde“, kritisiert ZEW-Wissenschaftler Sebastian Valet, Ko-Autor aus dem Forschungsbereich ’Digitale Ökonomie’.

Vier definierte Rollen

Entsprechend müssen für das Red Teaming klare Strukturen und Rollen definiert werden, damit die Potenziale dieses Prüfverfahrens effizient genutzt werden können. Die ZEW-Wissenschaftler schlagen dafür vier definierte Rollen vor, die je eigene Aufgaben, Ziele und Anreize haben, um den Prüfprozess möglichst effizient zu gestalten. Die Rollen sind 1) die Organisatoren der Prüfung, 2) das testende Red-Team, 3) Validierer, die entscheiden, ob tatsächlich ein Fehlverhalten gefunden wurde, und 4) das KI-Entwicklerteam. Jede dieser Rollen sollte dabei von unabhängigen Einheiten ausgefüllt werden. Nur so habe beispielsweise ein testendes Red-Team einen Anreiz seine Aufgabe bestmöglich zu erfüllen, so die Wissenschaftler.

Thematik: Allgemein, Generative künstliche Intelligenz – Generative Artificial Intelligence, Industrie 4.0 (I40), Märkte und Trends, News, Produktentwicklung, Produktionsmanagement

Zentrum für Europäische Wirtschaftsforschung

Zur Firmenwebsite

News

Bild: ©metamorworks/stock.adobe.com

Cybersicherheit

All for One Group beteiligt sich an BrightFlare

Die All for One Group, ein IT-, Consulting- und Service-Provider aus Filderstadt, beteiligt sich an dem österreichischen Cybersecurity-Spezialisten BrightFlare.

Weiterlesen: All for One Group beteiligt sich an BrightFlare
Bild: Heitec AG/ A+K

Intralogistik-Portfolio erweitert

Heitec übernimmt Artschwager + Kohl

Artschwager + Kohl Software ist seit Januar 2026 Teil der Heitec-Gruppe.

Weiterlesen: Heitec übernimmt Artschwager + Kohl
Bild: ©enzozo/stock.adobe.com

Google-Report zur Münchner Sicherheitskonferenz

Wenn KI-Modelle zum Angriffsziel werden

Zur Münchner Sicherheitskonferenz (13. bis 15. Februar) hat die Google Threat Intelligence Group (GTIG) einen Bericht veröffentlicht, mit dem die Verfasser die Debatte um KI-gestützte Bedrohungen auf eine operative Ebene ziehen.

Weiterlesen: Wenn KI-Modelle zum Angriffsziel werden
Bild: Hiscox Europe Underwriting Limited

Hiscox-Umfrage von Statista:

Mehr IT-Dienstleister erleben Vorwürfe wegen Schlechtleistung

Gegen zwei Drittel der IT-Dienstleister wurden im vergangenen Jahr seitens ihrer Auftraggeber Vorwürfe wegen angeblicher Schlechtleistung erhoben.

Weiterlesen: Mehr IT-Dienstleister erleben Vorwürfe wegen Schlechtleistung
Bild: ForeScout Technologies, Inc.

Dirk Decker übernimmt

Forescout ernennt Regional Director für Zentraleuropa

Forescout Technologies, ein Spezialist für Cybersicherheit, hat die Ernennung von Dirk Decker (Bild) zum Regional Director für Zentraleuropa bekanntgegeben.

Weiterlesen: Forescout ernennt Regional Director für Zentraleuropa
Bild: ©Kamran-Studio/stock.adobe.com

IBM X-Force Threat Index

KI hilft Angreifern, Schwachstellen schneller auszunutzen

In einem aktuellen Bericht weist IBM darauf hin, dass Cyberkriminelle grundlegende Sicherheitslücken in dramatisch höherem Maße ausnutzen.

Weiterlesen: KI hilft Angreifern, Schwachstellen schneller auszunutzen
Bild: Dragons, Inc.

Operative Störungen statt passive Erkundung

Wie Angreifer industrielle Steuerungssysteme ins Visier nehmen

Dragos, Cybersicherheitsspezialist für OT-Umgebungen, analysiert in einem Bericht aktuelle Cyberbedrohungen für industrielle und kritische Infrastrukturen.

Weiterlesen: Wie Angreifer industrielle Steuerungssysteme ins Visier nehmen
Bild: Neura Robotics

Gemeinsames Projekt der TU München und Neura Robotics

Ein Lernzentrum für Roboter entsteht

Das Munich Institute of Robotics and Machine Intelligence (MIRMI) der Technischen Universität München (TUM) und das Unternehmen Neura Robotics planen ein Forschungs- und Trainingszentrum für Robotik im wissenschaftlichen Bereich.

Weiterlesen: Ein Lernzentrum für Roboter entsteht
Bild: ©Nassorn/stock.adobe.com

Neues Gremium

Deutsche Gesellschaft für Robotik gegründet

Mit der Deutschen Gesellschaft für Robotik e.V. hat sich im März 2026 eine neue gemeinnützige Fachgesellschaft gegründet, die die Förderung von Wissenschaft, Forschung und Bildung im Bereich der Robotik zum Ziel hat.

Weiterlesen: Deutsche Gesellschaft für Robotik gegründet
Bild: ©greenbutterfly/stock.adobe.com

Was ist eigentlich was?

Ein kurzer Blick auf CRA, EU-Maschinenverordnung und NIS-2

Gezielte Cyberangriffe auf Anlagen und Maschinen sind längst Realität. Mit CRA, NIS2 und der neuen EU-Maschinenverordnung reagiert der Gesetzgeber nicht nur mit klaren Empfehlungen, sondern auch mit konkreten Meldepflichten, Vorgaben und Sanktionen. NTT Data fasst zusammen, was hinter den drei Vorgaben steckt und welche Auswirkungen sie haben.

Weiterlesen: Ein kurzer Blick auf CRA, EU-Maschinenverordnung und NIS-2

Reihe Wissen Kompakt

ERP

Ein Unternehmen, das sich mit der Auswahl eines ERP- Systems befasst, muss sich gleichsam mit einem viel- schichtigen Software-Markt und unklaren Interessen- lagen an interne Abwick- lungsprozesse auseinander- setzen. Guter Rat bei der Investitionsentscheidung ist teuer. ERP Wissen Kompakt unterstützt Sie bei der gezielten Investition in die IT-Infrastruktur.
KI Künstliche Intelligenz

Immer mehr Anbieter von Maschinen, Automatisierungstechnik und Industriesoftware integrieren künstliche Intelligenz in ihre Produkte. Das ganze Potenzial spielen selbstlernende Systeme aber erst aus, wenn sie passgenau auf ihren Einsatz in Fertigung und Büro zugeschnitten wurden. Über beide Möglichkeiten, als Fertiger die Vorzüge von industrieller KI zu nutzen, geht es im regelmäßig aktualisierten Themenheft Künstliche Intelligenz.
IIoT Industrial Internet of Things

Das Internet of Things verändert Produktwelten und die Vernetzung in der Fertigung gleichermaßen. Entstehende Ökosysteme laden zur einer neuen Form der Zusammenarbeit ein. Die Spezialausgabe IoT Wissen Kompakt informiert über die Technologie, Projektierung und Anbieter für die eigene Applikation, in- und außerhalb der Fabrik.
MES Manufacturing Execution Systems

Um alle Potenziale eines MES umfassend ausnutzen zu können, beleuchten unsere Autoren in der Serie von MES Wissen Kompakt die erfolgskritischen Faktoren, um Fertigungsunternehmen präventiv zu steuern. Darüber hinaus präsentiert MES Wissen Kompakt ein breites Spektrum an Firmenportraits, Produkt- neuheiten und Dienst- leistungen im MES-Umfeld.

Partner-Netzwerke

CtrlX-Partner

Hersteller von Automatisierungstechnik fügen eigene und von Partnern beigesteuerte IT- und Automatisierungskomponenten zunehmend zu Ökosystemen zusammen. CtrlX Automation von Bosch Rexroth ist mit über 100 Partnern eines der größten an Markt. Mit dem Portfolio lassen sich Automatisierungssysteme modular zusammenstellen und in die IT-Schicht integrieren.
Microsoft-Partner

Mittelständische Unternehmen investieren selbst in schwierigen Zeiten in Microsoft-Technologien, weil sie überzeugt sind, dass ihre Mitarbeiterproduktivität steigt und sich ihre Kostenstruktur bessert. Microsoft hat mit dem Microsoft-Partner-Network ein Netzwerk aufgebaut, das ein Forum für den Aufbau von Partnerschaften, Zugang zu Ressourcen und einen Rahmen für Dialoge und Kooperationen bietet.
SAP-Partner

Auf der Suche nach Innovation, nach neuen Lösungen und der Abgrenzung zum Mitbewerb vernetzen sich zunehmend mehr Unternehmen mit externen Experten und Partnern. SAP hat mit dem SAP-Ecosystem ein Netzwerk aufgebaut, das ein Forum für den Aufbau von Partnerschaften, Zugang zu Ressourcen und einen Rahmen für Dialoge und Kooperationen bietet.