placeholder

Demonstration und Feedback

Roboter lernen in der Interaktion mit dem Menschen

29. November 2024

Roboter könnten künftig im Alltag zahlreiche Aufgaben übernehmen – auf die Vorlieben ihrer Benutzer abgestimmt, wie sie durch einen Roboter unterstützt werden wollen. Das macht eine reine Vorprogrammierung künftiger Roboter fast unmöglich. Die Fähigkeit, neue Aufgaben in Interaktion mit Menschen zu erlernen, wird daher zu einer Schlüsselkomponente für die Entwicklung intelligenter Robotersysteme.

Ob Oberflächenbearbeitung oder Mülltrennung: Roboter können vom Menschen lernen, diese Aufgaben auszuführen. – Bild: Plattform Lernende Systeme

Um einem großen Teil der Gesellschaft die Teilhabe an lernfähigen Robotern zu ermöglichen, ist es dabei essenziell, dass Roboter in der Lage sind, auch von Alltagsnutzenden ohne Programmiervorkenntnisse neue Aufgaben zu erlernen.

Recycling komplett ph1 — Bild: Plattform Lernende Systeme

Lernen von Demonstrationen und Feedback

Zwei vielversprechende Ansätze, wie Roboter von Menschen lernen können, sind das Lernen von Demonstrationen und das interaktive Reinforcement-Lernen. Beim Lernen von Demonstrationen können Roboter entweder vom Menschen an die Hand genommen und durch die Aufgabe geführt werden oder sie beobachten Menschen, die selbst eine Aufgabe durchführen, versuchen anschließend das Gesehene zu verstehen und zu kopieren. Menschliche Demonstrationen können dabei zum einen genutzt werden, um bekannte Teilaufgaben wiederzuerkennen und in neuer Rheinfolge auszuführen sowie um komplett neue Bewegungs- und Aufgabenabläufe zu erlernen.

Beim interaktiven Reinforcement-Lernen hingegen nutzen Roboter durch Interaktion mit Menschen gewonnenes Feedback, um vorher Erlerntes iterativ zu verbessern. Menschen können dabei Roboter während der Ausführung ihrer Aufgaben bewerten. So können Roboter zusätzlich auch persönliche Präferenzen ihrer Nutzer für Aufgabendurchführungen lernen. Feedback kann hierbei entweder explizit z.B. über Tablet oder Spracheingabe gegeben werden oder Roboter lernen durch implizites Feedback, also dadurch, wie ihr Verhalten menschliches Verhalten oder den Erfolg der Aufgabendurchführung beeinflusst.

Menschliche Fehlerquellen beim Lernen

Lernfähige Robotiksysteme, die durch direkte Interaktion mit Menschen lernen und zuvor Gelerntes verbessern können, verfügen über großes Potenzial in vielen Einsatzbereichen. Voraussetzung: Die Roboter sind sicher. Eine wichtige Frage aktueller Forschung ist daher, wie man Roboter und die von ihnen genutzten Algorithmen gegen fehlerhafte oder unerwünschte menschliche Demonstrationen absichern kann. Im Gegensatz zu klassisch programmierten Robotern sollte bei lernfähigen Robotiksystemen z.B. sichergestellt werden, dass sie potenzielle Unsicherheiten oder Inkonsistenz in menschlichem Feedback verstehen. Ebenso wichtig ist es, dass die Roboter einen zuvor definierten Kernaufgabenbereich auch durch menschliche Demonstrationen nicht verlassen können.

Die Entwicklung von sicheren und menschenzentrierten zukünftigen Lernalgorithmen erfordert deswegen insbesondere interdisziplinäre Forschung aus Kognitionswissenschaften, Robotik und maschinellem Lernen. Ziel ist es zu verstehen, wie Menschen Demonstrationen und Feedback geben und geben wollen und zu erkunden, wie die Roboter der Zukunft davon am besten lernen können.

Roboter für eine bessere Trennung von Wertstoffen

Für die Mülltrennung existieren bereits gut funktionierende technische Lösungen. Menschen müssen dabei aber oft immer noch mithelfen, was meist zumindest belastend, manchmal auch gesundheitsschädlich oder gar gefährlich ist. Die Mülltrennung erreicht jedoch oft nicht die gewünschte Qualität und stößt dabei auch oft an Kapazitätsgrenzen, was die Qualität einer sauberen Mülltrennung zusätzlich senken kann. Pick&Place-Roboter werden heute schon breit eingesetzt und sind vergleichsweise günstig. Im Zusammenspiel mit geeigneter Sensorik könnten sie das manuelle Herausgreifen von Objekten in den Sortieranlagen automatisieren.

Zukunftsperspektiven mit KI

Lernen durch Interaktion kann dazu beitragen, dass über Zwischenschritte der Teilautomatisierung (Stichwort: variable Autonomie), höhere Autonomiegrade im Recycling erreicht werden und sukzessive mit jeder Interaktion auch die Robustheit der nötigen KI-Modelle gestärkt wird. Ein auf diese Weise verbessertes Recycling kann zu einem zentralen Bestandteil einer Kreislaufwirtschaft werden, insbesondere aufgrund multimodaler Sensorik wie z.B. der Detektion verborgener oder zu demontierender Objekte. Zudem stellt es eine Vorstufe zu weiteren Betriebsstationen dar, wie der Demontage, in der aussortierte Wertstoffe zerlegt und auch Rohstoffe wiedergewonnen werden. Innerhalb von bereits bestehenden Anlagen, in denen klassische Methoden der Müllsortierung angewandt werden, können lernfähige Robotiksysteme komplementär eingesetzt werden (z.B. zur Qualitätssteigerung und -sicherung).

So werden in mehrfacher Hinsicht Potenziale frei:

Freisetzung von Arbeitskraft für Aufgaben mit höherer Wertschöpfung durch Rationalisierung von unattraktiven, unangenehmen oder potenziell gefährlichen Arbeitsprozessen
Erhöhte Sicherheit für Menschen vor Gefahrstoffen und gefährlichen Objekten
Betriebswirtschaftliche Vorteile bei perspektivischer Vollautomatisierung: Günstigere Betriebsbedingungen sowie gegebenenfalls Wegfall von an Menschen angepasste (Sicherheits-) Bedingungen (Lüftung, Arbeitsraum, Unfallschutz etc.)

Quellen des Lernens

Beobachten menschlicher Aktivitäten, z.B. Lernen durch Demonstration (Was greift der Mensch wie?)
Hinweise des Menschen auf entferntere, zu sortierende Objekte, z.B. Zeigen mit einem Laserpointer oder auf übertragenen Kamerabildern des Förderbandes
Kommentierung durch den Menschen in der Lernphase, z.B. Benennung von Objekten, Materialien.
Menschliche (verbale) Kommentierung oder Instruktion, um Affordanzen (Objekt ist greifbar, anhebbar etc.) oder Greiffähigkeiten zu lernen
Simultanes Lernen von allen menschlichen Instruktoren an mehreren Förderbändern; so kann jede Roboterinstanz von den gelernten Fähigkeiten anderer Instanzen profitieren, z.B. Erkennen eines Objekts oder Ausführen eines Griffs

Methoden des Lernens

Reinforcement Learning (bestärkendes Lernen)
Ensemble-Lernen (gemeinsames Lernen, z.B. föderiertes Lernen)
Few-shot Learning (KI-Modelle entwickeln mit geringen Datenmengen)
Lernen im Team (bei mehreren Robotern)
Transfer Learning (verschiedene Domänen, z.B. zwischen örtlich getrennten Recyclinganlagen)
Selbstlernen/Weiterlernen ab einer gewissen Ergebnisqualität des Robotereinsatzes

Thematik: Robotik, Anwendungen & Lösungen, Industrie 4.0 (I40), Künstliche Intelligenz & maschinelles Lernen

Acatech – Dt. Akademie der Technikwissenschaften

Zur Firmenwebsite

News

Bild: ©metamorworks/stock.adobe.com

Cybersicherheit

All for One Group beteiligt sich an BrightFlare

Die All for One Group, ein IT-, Consulting- und Service-Provider aus Filderstadt, beteiligt sich an dem österreichischen Cybersecurity-Spezialisten BrightFlare.

Weiterlesen: All for One Group beteiligt sich an BrightFlare
Bild: Heitec AG/ A+K

Intralogistik-Portfolio erweitert

Heitec übernimmt Artschwager + Kohl

Artschwager + Kohl Software ist seit Januar 2026 Teil der Heitec-Gruppe.

Weiterlesen: Heitec übernimmt Artschwager + Kohl
Bild: ©enzozo/stock.adobe.com

Google-Report zur Münchner Sicherheitskonferenz

Wenn KI-Modelle zum Angriffsziel werden

Zur Münchner Sicherheitskonferenz (13. bis 15. Februar) hat die Google Threat Intelligence Group (GTIG) einen Bericht veröffentlicht, mit dem die Verfasser die Debatte um KI-gestützte Bedrohungen auf eine operative Ebene ziehen.

Weiterlesen: Wenn KI-Modelle zum Angriffsziel werden
Bild: Hiscox Europe Underwriting Limited

Hiscox-Umfrage von Statista:

Mehr IT-Dienstleister erleben Vorwürfe wegen Schlechtleistung

Gegen zwei Drittel der IT-Dienstleister wurden im vergangenen Jahr seitens ihrer Auftraggeber Vorwürfe wegen angeblicher Schlechtleistung erhoben.

Weiterlesen: Mehr IT-Dienstleister erleben Vorwürfe wegen Schlechtleistung
Bild: ForeScout Technologies, Inc.

Dirk Decker übernimmt

Forescout ernennt Regional Director für Zentraleuropa

Forescout Technologies, ein Spezialist für Cybersicherheit, hat die Ernennung von Dirk Decker (Bild) zum Regional Director für Zentraleuropa bekanntgegeben.

Weiterlesen: Forescout ernennt Regional Director für Zentraleuropa
Bild: ©Kamran-Studio/stock.adobe.com

IBM X-Force Threat Index

KI hilft Angreifern, Schwachstellen schneller auszunutzen

In einem aktuellen Bericht weist IBM darauf hin, dass Cyberkriminelle grundlegende Sicherheitslücken in dramatisch höherem Maße ausnutzen.

Weiterlesen: KI hilft Angreifern, Schwachstellen schneller auszunutzen
Bild: Dragons, Inc.

Operative Störungen statt passive Erkundung

Wie Angreifer industrielle Steuerungssysteme ins Visier nehmen

Dragos, Cybersicherheitsspezialist für OT-Umgebungen, analysiert in einem Bericht aktuelle Cyberbedrohungen für industrielle und kritische Infrastrukturen.

Weiterlesen: Wie Angreifer industrielle Steuerungssysteme ins Visier nehmen
Bild: Neura Robotics

Gemeinsames Projekt der TU München und Neura Robotics

Ein Lernzentrum für Roboter entsteht

Das Munich Institute of Robotics and Machine Intelligence (MIRMI) der Technischen Universität München (TUM) und das Unternehmen Neura Robotics planen ein Forschungs- und Trainingszentrum für Robotik im wissenschaftlichen Bereich.

Weiterlesen: Ein Lernzentrum für Roboter entsteht
Bild: ©Nassorn/stock.adobe.com

Neues Gremium

Deutsche Gesellschaft für Robotik gegründet

Mit der Deutschen Gesellschaft für Robotik e.V. hat sich im März 2026 eine neue gemeinnützige Fachgesellschaft gegründet, die die Förderung von Wissenschaft, Forschung und Bildung im Bereich der Robotik zum Ziel hat.

Weiterlesen: Deutsche Gesellschaft für Robotik gegründet
Bild: ©greenbutterfly/stock.adobe.com

Was ist eigentlich was?

Ein kurzer Blick auf CRA, EU-Maschinenverordnung und NIS-2

Gezielte Cyberangriffe auf Anlagen und Maschinen sind längst Realität. Mit CRA, NIS2 und der neuen EU-Maschinenverordnung reagiert der Gesetzgeber nicht nur mit klaren Empfehlungen, sondern auch mit konkreten Meldepflichten, Vorgaben und Sanktionen. NTT Data fasst zusammen, was hinter den drei Vorgaben steckt und welche Auswirkungen sie haben.

Weiterlesen: Ein kurzer Blick auf CRA, EU-Maschinenverordnung und NIS-2

Reihe Wissen Kompakt

ERP

Ein Unternehmen, das sich mit der Auswahl eines ERP- Systems befasst, muss sich gleichsam mit einem viel- schichtigen Software-Markt und unklaren Interessen- lagen an interne Abwick- lungsprozesse auseinander- setzen. Guter Rat bei der Investitionsentscheidung ist teuer. ERP Wissen Kompakt unterstützt Sie bei der gezielten Investition in die IT-Infrastruktur.
KI Künstliche Intelligenz

Immer mehr Anbieter von Maschinen, Automatisierungstechnik und Industriesoftware integrieren künstliche Intelligenz in ihre Produkte. Das ganze Potenzial spielen selbstlernende Systeme aber erst aus, wenn sie passgenau auf ihren Einsatz in Fertigung und Büro zugeschnitten wurden. Über beide Möglichkeiten, als Fertiger die Vorzüge von industrieller KI zu nutzen, geht es im regelmäßig aktualisierten Themenheft Künstliche Intelligenz.
IIoT Industrial Internet of Things

Das Internet of Things verändert Produktwelten und die Vernetzung in der Fertigung gleichermaßen. Entstehende Ökosysteme laden zur einer neuen Form der Zusammenarbeit ein. Die Spezialausgabe IoT Wissen Kompakt informiert über die Technologie, Projektierung und Anbieter für die eigene Applikation, in- und außerhalb der Fabrik.
MES Manufacturing Execution Systems

Um alle Potenziale eines MES umfassend ausnutzen zu können, beleuchten unsere Autoren in der Serie von MES Wissen Kompakt die erfolgskritischen Faktoren, um Fertigungsunternehmen präventiv zu steuern. Darüber hinaus präsentiert MES Wissen Kompakt ein breites Spektrum an Firmenportraits, Produkt- neuheiten und Dienst- leistungen im MES-Umfeld.

Partner-Netzwerke

CtrlX-Partner

Hersteller von Automatisierungstechnik fügen eigene und von Partnern beigesteuerte IT- und Automatisierungskomponenten zunehmend zu Ökosystemen zusammen. CtrlX Automation von Bosch Rexroth ist mit über 100 Partnern eines der größten an Markt. Mit dem Portfolio lassen sich Automatisierungssysteme modular zusammenstellen und in die IT-Schicht integrieren.
Microsoft-Partner

Mittelständische Unternehmen investieren selbst in schwierigen Zeiten in Microsoft-Technologien, weil sie überzeugt sind, dass ihre Mitarbeiterproduktivität steigt und sich ihre Kostenstruktur bessert. Microsoft hat mit dem Microsoft-Partner-Network ein Netzwerk aufgebaut, das ein Forum für den Aufbau von Partnerschaften, Zugang zu Ressourcen und einen Rahmen für Dialoge und Kooperationen bietet.
SAP-Partner

Auf der Suche nach Innovation, nach neuen Lösungen und der Abgrenzung zum Mitbewerb vernetzen sich zunehmend mehr Unternehmen mit externen Experten und Partnern. SAP hat mit dem SAP-Ecosystem ein Netzwerk aufgebaut, das ein Forum für den Aufbau von Partnerschaften, Zugang zu Ressourcen und einen Rahmen für Dialoge und Kooperationen bietet.