Robotik 2026 bringt eine neue Generation von Fachbegriffen mit — und viele davon haben keine etablierte deutsche Übersetzung. Dieses Glossar sammelt die wichtigsten Begriffe, die dir in unseren Artikeln begegnen. Jeder Begriff verlinkt, wo sinnvoll, auf tiefere Artikel im KI-Hub oder bei den Modell-Profilen.
KI-Glossar — Physical AI erklärt.
Embodied AI, VLA, GR00T, π0, ROS2, Teleoperation, ATEX — die wichtigsten Begriffe der Robotik-Welt 2026. Auf Deutsch, ohne Tech-Jargon, mit direkten Verlinkungen auf relevante Modelle und Hubs.
A
EU-Richtlinie für explosionsgeschützte Geräte. Relevant für Roboter in Chemie, Öl und Gas. Zone 1 ist der strengste Standard — nur ANYmal X (Quadruped) ist 2026 zertifiziert.
Skala von Level 0 (reiner Teleoperation) bis Level 5 (voll autonom). Humanoide 2026 stehen bei Level 2–3 — sie können Kernaufgaben autonom, brauchen aber Human-in-the-Loop-Fallback.
C
Konformitätszeichen für EU-Binnenmarkt. Ohne CE darf kein Gerät "in Verkehr gebracht" werden. Import-Roboter aus China haben es meist nicht — rechtliche Grauzone für Privat-Eigengebrauch.
D
Freiheitsgrade — Anzahl unabhängiger Bewegungsrichtungen eines Roboters. Unitree G1 Basis hat 23 DOF, EDU-Version 43 DOF. Menschen haben ca. 250+ DOF.
Teslas eigener Supercomputer zum Training von KI-Modellen — ursprünglich für FSD (Full Self-Driving), jetzt auch für Optimus. Alternative zu NVIDIA-basierter Cloud-Infrastruktur.
E
KI-Systeme, die in einen physischen Körper eingebettet sind — also Roboter, die sehen, handeln und lernen, statt nur Text zu generieren. Synonym zu Physical AI.
F
Großes neuronales Netz, das als Basis für viele Aufgaben dient. Bei Robotern: Vision-Language-Action-Modell (VLA) wie NVIDIA GR00T, Figure Helix, Physical Intelligence π0.
Teslas Full-Self-Driving-Neural-Net, ursprünglich für Autos. Wird für Optimus adaptiert. Vorteil: Milliarden Fahr-Trainingsstunden. Nachteil: Autos brauchen keine Feinmotorik.
G
Googles Vision-Language-Action-Modell für Roboter, 2026 in enger Integration mit Boston Dynamics Spot live. Ermöglicht Sprachsteuerung für Inspektions-Tasks.
NVIDIAs Foundation-Model für Humanoide. Aktuelle Version GR00T N2 erweitert um DreamZero World-Model. Referenz-Plattformen: Unitree G1, Agility Digit, Apptronik Apollo.
H
Figure AIs proprietäres VLA-Modell. Aktuell Helix-02, parallel zu Figure 03 wird Helix-03 erwartet. Trainiert auf BMW-Spartanburg und BotQ-Daten.
Design-Prinzip, bei dem ein menschlicher Operator den Roboter per Teleoperation steuert, wenn die KI überfordert ist. 1X NEO kommuniziert das offen als Teil der Consumer-Strategie.
I
Schutz gegen Staub und Wasser. IP54 = gespritztes Wasser, für Innen und kurzen Außeneinsatz. IP67 = zeitweise wasserdicht, für Industrie-Umgebungen. Viele Consumer-Quadrupeds sind nur IP54.
J
NVIDIAs aktuelle Robotik-Recheneinheit (Nachfolger von Orin). 2000 TOPS Leistung, für Humanoide konzipiert. Basis für GR00T-Ausführung.
L
Light Detection and Ranging — 3D-Laser-Scanner für Umgebungs-Erfassung. Bei Unitree Go2 optional (+1.500 USD), bei Spot Standard. Alternative: Stereokameras mit Depth-Fusion.
P
Synonym zu Embodied AI. Wird zunehmend als Sammelbegriff für KI-Systeme verwendet, die mit der physischen Welt interagieren — im Unterschied zu reinen Sprach-/Bild-Modellen.
Startup-VLA-Modell mit Fokus auf Generalisierung. π0.5 generalisiert auf unbekannte Wohnungen ohne Fine-Tuning — für Consumer-Humanoide ein Schlüssel-Merkmal.
R
Geschäftsmodell, bei dem Unternehmen Roboter pro erledigter Aufgabe mieten, statt kaufen. Agility Robotics ist 2026 Vorreiter — Amazon zahlt pro Regal-Task bei Digit.
1X Technologies Foundation-Model für NEO. Kombiniert autonome Fähigkeiten mit Teleoperations-Fallback. Weniger öffentlich dokumentiert als GR00T oder π0.
Robot Operating System, Version 2 — Open-Source-Framework für Roboter-Software. Standard an Unis und in der Industrie. Unitree Pro und EDU liefern ROS2-Schnittstellen mit.
S
Programmier-Schnittstelle für eigene Roboter-Skills. Unitree SDK ist offen, NVIDIA GR00T-SDK ebenfalls. Figure und 1X halten ihre SDKs intern.
T
Fernsteuerung eines Roboters durch einen Menschen — oft via VR-Headset. Wird bei Figure, 1X und Tesla aktiv genutzt, um autonome Grenzen zu überbrücken und gleichzeitig Trainings-Daten zu generieren.
V
Architektur-Klasse für Roboter-Foundation-Models. Das Modell sieht Bilder, versteht Sprach-Anweisungen und leitet daraus Bewegungen ab. GR00T, Helix, π0 sind alle VLA-Modelle.
W
KI-Komponente, die eine interne Simulation der Welt vorhersagt — "was passiert als Nächstes?". NVIDIAs DreamZero (Teil von GR00T N2) ist ein prominentes Beispiel. Ermöglicht vorausschauende Aktionen.
Häufige Verständnis-Fragen
Was ist der Unterschied zwischen Physical AI und Embodied AI?
Praktisch keiner — beide Begriffe bezeichnen KI-Systeme, die in einen physischen Körper (meist einen Roboter) eingebettet sind. Physical AI ist der von NVIDIA seit 2024 prominent genutzte Marketing-Begriff. Embodied AI ist der ältere, akademisch geprägte Begriff. Die Bedeutung ist identisch.
Was ist ein VLA-Modell?
Ein Vision-Language-Action-Modell ist ein neuronales Netz, das gleichzeitig Bilder sehen, Sprach-Anweisungen verstehen und daraus Roboter-Bewegungen ableiten kann. Beispiele: NVIDIA GR00T, Figure Helix, Physical Intelligence π0, Google Gemini Robotics. VLA ist die Standard-Architektur für moderne humanoide Roboter 2026.
Was bedeutet 'Human-in-the-Loop'?
Ein Design-Prinzip, bei dem ein Mensch per Teleoperation einspringt, wenn die KI des Roboters überfordert ist. 1X Technologies nutzt das bei NEO explizit — wenn NEO eine unerwartete Situation trifft, übernimmt ein Operator via VR-Headset. Kritiker nennen das 'nicht wirklich autonom', Befürworter einen pragmatischen Brücken-Ansatz zur echten Autonomie.
Was ist ein Foundation Model für Roboter?
Ein großes vortrainiertes neuronales Netz, das als Basis für viele verschiedene Roboter-Aufgaben dient — analog zu GPT-4 oder Claude für Text. Der entscheidende Sprung: Ein Roboter mit Foundation Model braucht nicht für jede Aufgabe einzeln programmiert werden, sondern kann auf Anweisung reagieren.