Spezielle Chips für reduzierten KI-Energieverbrauch

Das System des Supercomputers 'Otus' der Universität Paderborn ist auf bis zu 100 FPGA-Karten erweiterbar und dann eines der stärksten FPGA-Systeme weltweit.
Das System des Supercomputers ‚Otus‘ der Universität Paderborn ist auf bis zu 100 FPGA-Karten erweiterbar und dann eines der stärksten FPGA-Systeme weltweit.Bild: Thorsten Hennig / Universität Paderborn

Im Rahmen des KI-Leuchtturmprojekts ‚Eki‘ hat ein Forschungsteam unter der Leitung der Universität Paderborn an der Verbesserung der Energieeffizienz von KI-Systemen gearbeitet und Methoden entwickelt, mit denen sich der Energieverbrauch von KI um bis zu 90% senken lässt. Dafür setzen die Forschenden auf spezielle Computerchips. Das Bundesministerium für Umwelt, Klimaschutz, Naturschutz und nukleare Sicherheit hat das Vorhaben mit rund 1,5Mio.€ über einen Zeitraum von drei Jahren gefördert.

Energieeffizienz verbessert

Tiefe neuronale Netze (englisch: Deep Neural Networks, DNNs) sind elementarer Bestandteil von KI und werden in einem aufwendigen Prozess mit sehr großen Datenmengen trainiert. Deshalb sind sie für einen zunehmenden Anteil der Rechenlast und damit für den Energieverbrauch sowie CO2-Ausstoß in Rechenzentren verantwortlich. Prof. Dr. Marco Platzner vom Institut für Informatik an der Universität Paderborn hat das Projekt geleitet und erklärt: „Tiefe neuronale Netze sind eine Art KI, die nach dem Prinzip des menschlichen Gehirns funktioniert. Der ‚tiefe‘ Teil bezieht sich darauf, dass die Netze viele Schichten haben, die Daten verarbeiten und Muster erkennen, Bilder analysieren sowie Sprache verarbeiten.“ Nachdem die DNNs mit riesigen Datenmengen trainiert worden sind, kommen die Modelle, die aus dem Prozess resultieren, zum Einsatz. In der Regel werden dafür GPUs oder CPUs genutzt, die jedoch eine geringe Energieeffizienz aufweisen. Die Lösung des Projektteams: Mithilfe frei programmierbarer Chips, sogenannten ‚Field-Programmable Gate Arrays‘ (FPGAs), lässt sich die Energieeffizienz von KI-Systemen für die DNN-Berechnung optimieren.

Unterschiede zu herkömmlichen Prozessoren

Zum Vergleich: Herkömmliche Prozessoren führen feste Befehlssätze aus, während die Schaltung bei FGPAs selbst angepasst werden kann. So entsteht eine Art maßgeschneiderte Hardware. Dies hat zur Folge, dass die Chips je nach Anwendung weniger Energie verbrauchen und schneller rechnen als Grafikprozessoren. Das Team verweist jedoch darauf, dass sie aufwendiger zu programmieren sind. Aber auch dieses Problem sind die Forschenden des Fachgebiets Technische Informatik angegangen. Denn sie beschäftigen sich schon lange gemeinsam mit dem Paderborn Center for Parallel Computing (PC2) der Universität Paderborn mit dem energieeffizienten Rechnen mithilfe von FPGAs. „Die Firma AMD/Xilinx hatte bereits das Open-Source-Programm Finn für neuronale Netze auf FPGAs entwickelt. In enger Zusammenarbeit konnten wir unsere Erfahrungen einbringen, um Finn noch besser zu machen und den Schwerpunkt auf Energieeffizienz zu legen“, erklärt Platzner.

Um den Energiebedarf zu senken, haben die Wissenschaftlerinnen und Wissenschaftler die KI-Modelle vereinfacht, indem sie u.a. unnötige Verbindungen innerhalb der KI entfernt und dafür gesorgt haben, dass komplexe Funktionen effizient laufen. DNNs wurden dabei auch auf mehrere FGPAs verteilt. Ein weiterer Schwerpunkt war, verlässliche Methoden zu entwickeln, um den Energiebedarf einzelner Komponenten vorhersagen zu können. Das ist dem Team durch die Erweiterung von Finn gelungen. Zudem konnten sie den Verbrauch kompletter Inferenzläufe messen und mit anderen Technologien vergleichen. Ein Inferenzlauf ist der Moment, in dem ein KI-Modell seine Kenntnisse anwendet, um auf neue Daten zu reagieren. „Besonders erfreulich ist, dass wir eine erhöhte Energieeffizienz bis zum Zehnfachen gegenüber der Verwendung von Grafikprozessoren erreichen konnten. Das senkt nicht nur den Stromverbrauch, sondern auch – je nach Strommix – den Ausstoß von CO2-Emissionen. Da der Einsatz von KI stetig wächst, wird in Zukunft der Energiebedarf von DNNs zu einem wichtigen Umweltfaktor“, resümiert Platzner.

Der vom Forschungsteam entwickelte Code steht in Finn offen zur Verfügung. Zudem bietet das PC2 der Universität Paderborn Workshops an, um Interessierte in die Nutzung der Methoden zur DNN-Abbildung auf FGPA-Systemen und zur Energieanalyse einzuführen.

Neben der Universität Paderborn waren die Hochschule Hamm-Lippstadt, die Fachhochschule Südwestfalen, das HPC-Unternehmen MEGWARE (Chemnitz) und die AMD Research Labs in Irland am Projekt beteiligt.