Industrielle Sprachsteuerung Wie es ist, eine Maschine mit Sprache zu steuern

Aktualisiert am 15.02.2021 Von Sariana Kunze

Anbieter zum Thema

Erst Knöpfe, jetzt Touch-Panels, dann Spracheingabe – bei Geräten im privaten Umfeld längst Standard. Werden wir bald auch in der Industrie Maschinen über Sprachkommandos steuern? Und: kann das überhaupt funktionieren? Sariana Kunze sprach mit einer Maschine.

Mit der Macht der Wort Maschinen steuern.
Mit der Macht der Wort Maschinen steuern.
(Bild: ©ra2 studio - stock.adobe.com)

Ich beuge mich vor, spreche laut und deutlich: „Hey MGA.“ Ein Bing ist zu hören. Das Aktivierungswort hat funktioniert. Die Maschine hat mich verstanden, wartet auf mein Kommando. In Hochdeutsch sage ich: „Automatikbetrieb.“ Nichts passiert. Es bleibt still. Ein kurzer Blick in das Handbuch verrät mir, was die richtigen Zauberworte für die von mir gewünschte Aktion sind. Also von vorne: „Hey MGA.“ Ein Bing. „Automatikmodus.“ Eine Frauenstimme antwortet aus einem Lautsprecher: „Automatikmodus aktiviert.“ Rechts neben dem Prototyp-Aufbau beginnt es plötzlich zu surren, das Förderband einer Lernfabrik von Fischertechnik setzt sich in Bewegung. Die Miniaturfabrik transportiert jetzt kleine, runde Klötzchen, die Werkstücke darstellen sollen, von dem einen Ende der Produktionsstraße zu dem anderen. Erst wird ein rotes bearbeitet, dann ein weißes, nun ein blaues.

Sprachsteuerung kostet nicht mehr als eine Visualisierung

Ich habe mit einer Maschine gesprochen. Sie steht in einem Büro in der Würzburger Innenstadt. Der Raum ist die Wirkungsstätte von Lorenz Arnold. Er ist seit nunmehr 22 Jahren Inhaber und auch Gründer der MGA Ingenieurdienstleistungen GmbH, einem Entwicklungsdienstleister für Automatisierungstechnik. „Für den Maschinenbau in ganz Deutschland entwickeln, konstruieren, programmieren und nehmen wir in Betrieb“, beschreibt Arnold. „Wo eine Steuerung drin steckt, mit der wir uns auskennen, können wir auch was tun.“ Gemeinsam mit seinem 60-köpfigen Team, ein Großteil Automatisierungstechniker, hat Arnold einen Laboraufbau entwickelt, der aus einem IPC, Bedienpanel und einer integrierten Sprachsteuerung besteht.

„Von Zeit zu Zeit picken wir uns Trendthemen heraus und beginnen zu entwickeln. An Ostern haben wir angefangen“, erklärt der Ingenieur. „Unser Ziel ist es, eine reine Softwarelösung hinzubekommen, die sich in vorhandene Steuerungen integrieren lässt. Der Maschinenbauer soll neben seiner CPU keine zusätzliche Hardware benötigen.“ Am Prototyp konnte der Entwicklungsdienstleister das noch nicht umsetzen, es ist noch eine zusätzliche Platine und ein Onboard-Mikrofon angebaut. „Es ist ja noch der Prototyp“, bemerkt Arnold.

Wir haben die Glühbirne nicht erfunden, aber wir haben sie in die Fassung gedreht.

Lorenz Arnold

Für MGA ist es wichtig, eine kostengünstige Spracheingabe, die für mehr als 20 Sprachen ausgelegt ist, anbieten zu können. „Wir haben festgelegt, dass die Sprachsteuerung nicht mehr als eine Visualisierung kosten darf“, sagt der Inhaber. Die Lösung soll Maschinenbauer wettbewerbsfähiger machen.

Durch Zufall kam der gebürtige Schwabe auf die Idee eine Sprachsteuerung für Maschinen zu entwickeln. „Ein Messebesuch gab im vergangenen Jahr den entscheidenden Impuls. Ich habe schnell gemerkt, dass Spracheingabe für Maschinensteuerung nicht groß besetzt ist“, erklärt er und merkt an: „Wir haben die Sprachsteuerung ja nicht erfunden, wir satteln nur auf Dingen auf, die es am Markt bereits gibt.“

Sprachsteuerung

Für welche Anwendungen sich Spracheingabe in der Industrie eignet

- Produktionsprozesse (z. B. Fertigen, Rüsten etc.),
- Service-Aufgaben (z. B. Wartung, Montage),
- Qualitätssicherung (z. B. Datenerfassung),
- Mensch-Roboter-Kollaboration,
- Warenwirtschaft (z. B. Datenabruf in Verbindung mit einem ERP-System),
- Steuerung von Betriebsabläufen (z. B. bei Maschinen und Geräten).

Sprachsteuerung noch weitgehend ungenutzt

Jan Wellmann, Gruppenleiter Automatische Spracherkennung beim Fraunhofer-Institut für Digitale Medientechnologie (IDMT) in Oldenburg bestätigt die Aussage: „Die Potenziale für industrielle Anwendungen sind bisher weitgehend ungenutzt.“ Kaum zu glauben, da das Thema generell in der Industrie nicht neu ist. „Pick-by-Voice, die Sprachkommissionierung, gibt es beispielsweise schon seit über 20 Jahren“, ordnet Arnold ein. Für die Maschinensteuerung ist diese Lösung jedoch nicht geeignet. „Sie ist ganz anders und benötigt einen eigenen Rechner.“

Anwendungsszenario für Montage und Bearbeitung

Bei der Sprachsteuerung für Industriemaschinen geht es darum, dass die Befehle nicht mehr über ein Bedienpanel eingegeben werden müssen. Der Maschinenbediener hat die Hände frei. Ziel ist es, dass Anwender Maschinen genauso benutzen können, wie sie es von Geräten aus ihrem privaten Umfeld (PKW, Smartphone etc.) gewohnt sind. „Jüngere Maschinenbediener werden in naher Zukunft nicht mehr verstehen, warum sie bei der Bedienung noch Knöpfe drücken müssen“, ist sich Arnold sicher. Zudem ist es ein Komfortgewinn und kann die Produktivität steigern.

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Ein denkbares Anwendungsszenario ist die Montage oder Bearbeitung. „Nicht jeder Handarbeitsplatz ist kompakt. Heute müssen Bediener noch oft zur Maschine gehen, um auf das Bedienpanel zu drücken“, beschreibt der Ingenieur. Wellmann vom Fraunhofer IDMT nennt noch eine weitere sinnvolle Anwendung: „Überall dort, wo ein erhöhtes Verletzungsrisiko besteht, kann dieses mit Sprachsteuerung verringert werden. Beispielsweise bei Maschinen, wo ein Sicherheitsabstand eingehalten werden muss.“

Smarte Kopfhörer

Fraunhofer IDMT arbeitet an Hearables

Aktuell arbeitet das Fraunhofer IDMT an einer mobilen Plattform zur Integration verschiedener technologischer Lösungen des Institutsteils. Das „Hearable für den smarten Industriearbeitsplatz“ soll dabei sowohl das Gehör vor lauten Umgebungsgeräuschen schützen, als auch eine kristallklare Kommunikation ermöglichen – sowohl mit Menschen als auch mit Maschinen. Für letzteres Szenario kommt dabei u.a. die automatische Spracherkennung ins Spiel.

Geräuschkulisse ist K.O.-Kriterium

Und was sagt der Maschinenbau zur Sprachsteuerung? Arnold hat eine Befragung bei seinen Kunden durchgeführt. Das Ergebnis: „Keiner hatte bislang eine Sprachsteuerung umgesetzt. Die Resonanz ist aber positiv ausgefallen.“ Bei der Kundenbefragung bekam MGA auch gespiegelt, dass mehr nicht immer besser ist. „Unsere Kunden wollen beispielsweise nicht, dass die Maschine ständig quasselt“, sagt Arnold. Ein K.O.-Kriterium wurde auch deutlich: Die Hintergrundgeräusche. „Ich kann die Vorbehalte verstehen, als Ingenieur muss ich aber sagen, das Problem ist lösbar“, ist sich Arnold sicher. Am Markt gibt es bereits Mikrofone, die Noise Cancelling integriert haben. Ein Mikrofon filtert Geräusche heraus und eines zeichnet die Sprache auf. „Wenn wir das Thema Hintergrundgeräusche in den Griff bekommen, ist der Drops gelutscht“, bekräftigt der Inhaber.

Schlimmster Fall: Die Maschine hat mich missverstanden

Es gibt aber noch ein größeres Problem als eine laute Produktionsumgebung: Wenn die Maschine den Anwender missversteht. „Das ist der schlimmste Fall. Der darf nicht passieren“, unterstreicht Arnold. „Es ist nicht schlimm, wenn die Maschine mich nicht versteht, dann passiert nichts. Ein echtes Problem habe ich, wenn die Maschine etwas tut, das ich nicht will.“ Um Falschinterpretationen auszuschließen, gibt der Experte den Tipp, möglichst unterschiedliche Befehle festzulegen. „Es bleibt aber ein Restrisiko“, gibt er zu. Letztendlich kann das System nur Begriffe verstehen, die bei der Projektierung hinterlegt wurden. Natürliche Sprache begreift der Prototyp nicht. Es liegt keine künstliche Intelligenz dahinter, da es sich um eine Offline-Lösung handelt. „Trotz Industrie 4.0 wünschen sich unsere Kunden eine Offline-Lösung. Wir könnten an bestehende Systeme von Google oder Amazon andocken, verständlicherweise will das keiner“, erklärt Arnold die Marktsicht. Als Entwicklungsdienstleister erstellt MGA individuelle Lösungen für die jeweilige Anwendung der Maschinenbauer. Diese ist dann deren Eigentum. Es soll verschiedene Ausführungen für Hard- und Softwareplattformen geben.

Bosch Rexroth setzt auf Spracheingabe von MGA

Mit einer dieser Ausführungen setzt Bosch Rexroth, Industrieunternehmen im Bereich der Antriebs- und Steuerungstechnik, das Sprachsteuerungssystem von MGA Ingenieurdienstleistungen ein. Für die offene Automatisierungsplattform Ctrl X Automation des Unternehmens bietet MGA als Partner eine Spracheingabe-App an. Mit der App lässt sich beispielsweise ein Antrieb steuern, ein- und wieder ausschalten, die Geschwindigkeit hoch- oder runterfahren.

„Mit MGA haben wir erprobt, wie einfach sich Spracheingabe bei der Ctrl X implementieren lässt“, sagt Steffen Winkler, Vertriebsleiter Business Unit Automation & Electrification Solutions, Bosch Rexroth AG. Er steht der Spracheingabe im Maschinenbau aber auch kritisch gegenüber: „Um ehrlich zu sein, sehe ich im klassischen Maschinenbau-Umfeld zunächst keine rasante Verbreitung von einer industriellen Sprachsteuerung. Wo Lärm stattfindet, wird es aus Sicherheitsgründen eher schwierig sein. Wir schließen es aber für die Zukunft nicht aus.“

Wird sich die Sprachsteuerung durchsetzen?

Auch für Arnold bleibt nur der Blick in die Glaskugel: „Wir sind noch nicht so weit, dass ein Maschinenbauer Entwicklungsbudget auf den Tisch legt. Vielleicht ist die Zeit jetzt reif.“ Bei MGA sieht man die Spracheingabe derzeit nicht als Ersatz, sondern als Ergänzung zu einem Bedienpanel. Das heißt: Es gibt immer eine Alternative zur Sprachsteuerung – falls diese nicht funktioniert.

Maschinen mit Macht der Worte stoppen

Noch immer befindet sich die Lernfabrik im Automatikmodus. „Es ist Zeit, sie zu deaktivieren“, bemerkt Lorenz Arnold. Ich frage mich: Wird die Anlage durch die Spracheingabe stoppen? Brauche ich mehrere Versuche? „Probieren Sie es aus oder drücken Sie einfach den Not-Aus-Knopf“, schmunzelt der Ingenieur. Ich versuche es: „Hey MGA.“ Ein Bing, der Prototyp ist bereit, hört mir zu: „Anlage stopp.“ Das Surren verstummt. Das Förderband hat angehalten. Ich habe eine Fabrik im Miniformat per Sprache bedient und sie hat mich verstanden.

Sprachassistenten: Wen lassen wir mithören?
Kommentar

Sariana Kunze, Fachredakteurin Automatisierung, Vogel Communications Group.
Sariana Kunze, Fachredakteurin Automatisierung, Vogel Communications Group.
(Bild: Vogel Communications Group)

Siri, Alexa, Bixby und Cortana. Die Sprachassist(inn)en von Apple, Amazon, Samsung und Microsoft & Co. sollen uns das Leben erleichtern, damit wir die Hände freihaben. Aber Hand aufs Herz: Wer nutzt sie täglich? Und: Funktioniert die Spracheingabe immer tadellos?

Meine Erfahrung ist jein. Ich nutze die Sprachassistentin meines Smartphones oder den Assistenten meines PKWs nur gelegentlich. Denn manchmal wollen sie mich einfach nicht verstehen. Was privat nur ärgerlich ist, ist in der Fabrik ein No-Go. Stellen Sie sich vor, Sie müssten Ihr Kommando zur Maschinenbedienung fünf Mal verbal wiederholen. Per Touch-Eingabe geht das dann allemal schneller.

Ein noch größerer Knackpunkt ist in der Industrie die Datensicherheit. Wer keine Offline-Lösung nutzt, muss Informationen über sich preisgeben, die der Sprachassistent mithilfe von künstlicher Intelligenz verarbeitet. Das wollen viele Anwender nicht. Also hat Lorenz Arnold von MGA Ingenieurdienstleistungen eine Software zur Offline-Spracheingabe entwickelt. Spectra, ein weiterer Anbieter von industrieller Spracheingabe, setzt auf eine Embedded-Lösung, die ebenfalls offline arbeitet. Die lokale Sprachsteuerung ist hierbei auf einem Mini-PC oder Panel-PC von Spectra enthalten. Auch der Automatisierer Beckhoff aus Verl hat vor zwei Jahren seine Automatisierungssoftware um eine Maschinenbedienung per Spracheingabe erweitert. Diese Sprachsteuerung kann online, aber auch offline genutzt werden.

Können – wenn überhaupt – in der Industrie also nur Offline-Lösungen überzeugen? Betreiber gehen ohne eine Verbindung zum Internet auf Nummer sicher, können aber die Vorteile eines selbstlernenden Systems nicht nutzen. Ein verschmerzbarer Verzicht? In meinem privaten Umfeld lassen immer mehr Menschen Apple, Amazon, Samsung, Microsoft & Co. mithören, ohne darüber nachzudenken. Es will eben keiner mehr auf diese Vorteile verzichten. Früher undenkbar, heute ganz normal. Es bleibt also spannend, was sich bei der Maschinenbedienung durchsetzen wird. Dann ist eine Online-Lösung vielleicht in einigen Jahren ganz normal.

* Sariana Kunze, Fachredakteurin Automatisierung, Vogel Communications Group

(ID:46994074)