KI-Glossar

KI-Glossar — Physical AI erklärt.

Embodied AI, VLA, GR00T, π0, ROS2, Teleoperation, ATEX — die wichtigsten Begriffe der Robotik-Welt 2026. Auf Deutsch, ohne Tech-Jargon, mit direkten Verlinkungen auf relevante Modelle und Hubs.

Robotik 2026 bringt eine neue Generation von Fachbegriffen mit — und viele davon haben keine etablierte deutsche Übersetzung. Dieses Glossar sammelt die wichtigsten Begriffe, die dir in unseren Artikeln begegnen. Jeder Begriff verlinkt, wo sinnvoll, auf tiefere Artikel im KI-Hub oder bei den Modell-Profilen.

A

ATEX

EU-Richtlinie für explosionsgeschützte Geräte. Relevant für Roboter in Chemie, Öl und Gas. Zone 1 ist der strengste Standard — nur ANYmal X (Quadruped) ist 2026 zertifiziert.

Autonomie-Level

Skala von Level 0 (reiner Teleoperation) bis Level 5 (voll autonom). Humanoide 2026 stehen bei Level 2–3 — sie können Kernaufgaben autonom, brauchen aber Human-in-the-Loop-Fallback.

C

CE-Kennzeichnung

Konformitätszeichen für EU-Binnenmarkt. Ohne CE darf kein Gerät "in Verkehr gebracht" werden. Import-Roboter aus China haben es meist nicht — rechtliche Grauzone für Privat-Eigengebrauch.

D

DOF (Degrees of Freedom)

Freiheitsgrade — Anzahl unabhängiger Bewegungsrichtungen eines Roboters. Unitree G1 Basis hat 23 DOF, EDU-Version 43 DOF. Menschen haben ca. 250+ DOF.

Dojo

Teslas eigener Supercomputer zum Training von KI-Modellen — ursprünglich für FSD (Full Self-Driving), jetzt auch für Optimus. Alternative zu NVIDIA-basierter Cloud-Infrastruktur.

E

Embodied AI

KI-Systeme, die in einen physischen Körper eingebettet sind — also Roboter, die sehen, handeln und lernen, statt nur Text zu generieren. Synonym zu Physical AI.

F

Foundation Model

Großes neuronales Netz, das als Basis für viele Aufgaben dient. Bei Robotern: Vision-Language-Action-Modell (VLA) wie NVIDIA GR00T, Figure Helix, Physical Intelligence π0.

FSD-Stack

Teslas Full-Self-Driving-Neural-Net, ursprünglich für Autos. Wird für Optimus adaptiert. Vorteil: Milliarden Fahr-Trainingsstunden. Nachteil: Autos brauchen keine Feinmotorik.

G

Gemini Robotics

Googles Vision-Language-Action-Modell für Roboter, 2026 in enger Integration mit Boston Dynamics Spot live. Ermöglicht Sprachsteuerung für Inspektions-Tasks.

GR00T (NVIDIA)

NVIDIAs Foundation-Model für Humanoide. Aktuelle Version GR00T N2 erweitert um DreamZero World-Model. Referenz-Plattformen: Unitree G1, Agility Digit, Apptronik Apollo.

H

Helix

Figure AIs proprietäres VLA-Modell. Aktuell Helix-02, parallel zu Figure 03 wird Helix-03 erwartet. Trainiert auf BMW-Spartanburg und BotQ-Daten.

Human-in-the-Loop

Design-Prinzip, bei dem ein menschlicher Operator den Roboter per Teleoperation steuert, wenn die KI überfordert ist. 1X NEO kommuniziert das offen als Teil der Consumer-Strategie.

I

IP-Schutzklasse (IP54/67)

Schutz gegen Staub und Wasser. IP54 = gespritztes Wasser, für Innen und kurzen Außeneinsatz. IP67 = zeitweise wasserdicht, für Industrie-Umgebungen. Viele Consumer-Quadrupeds sind nur IP54.

J

Jetson Thor (NVIDIA)

NVIDIAs aktuelle Robotik-Recheneinheit (Nachfolger von Orin). 2000 TOPS Leistung, für Humanoide konzipiert. Basis für GR00T-Ausführung.

L

LiDAR

Light Detection and Ranging — 3D-Laser-Scanner für Umgebungs-Erfassung. Bei Unitree Go2 optional (+1.500 USD), bei Spot Standard. Alternative: Stereokameras mit Depth-Fusion.

P

Physical AI

Synonym zu Embodied AI. Wird zunehmend als Sammelbegriff für KI-Systeme verwendet, die mit der physischen Welt interagieren — im Unterschied zu reinen Sprach-/Bild-Modellen.

π0 / π0.5 (Physical Intelligence)

Startup-VLA-Modell mit Fokus auf Generalisierung. π0.5 generalisiert auf unbekannte Wohnungen ohne Fine-Tuning — für Consumer-Humanoide ein Schlüssel-Merkmal.

R

RaaS (Robotics-as-a-Service)

Geschäftsmodell, bei dem Unternehmen Roboter pro erledigter Aufgabe mieten, statt kaufen. Agility Robotics ist 2026 Vorreiter — Amazon zahlt pro Regal-Task bei Digit.

Redwood

1X Technologies Foundation-Model für NEO. Kombiniert autonome Fähigkeiten mit Teleoperations-Fallback. Weniger öffentlich dokumentiert als GR00T oder π0.

ROS2

Robot Operating System, Version 2 — Open-Source-Framework für Roboter-Software. Standard an Unis und in der Industrie. Unitree Pro und EDU liefern ROS2-Schnittstellen mit.

S

SDK (Software Development Kit)

Programmier-Schnittstelle für eigene Roboter-Skills. Unitree SDK ist offen, NVIDIA GR00T-SDK ebenfalls. Figure und 1X halten ihre SDKs intern.

T

Teleoperation

Fernsteuerung eines Roboters durch einen Menschen — oft via VR-Headset. Wird bei Figure, 1X und Tesla aktiv genutzt, um autonome Grenzen zu überbrücken und gleichzeitig Trainings-Daten zu generieren.

V

VLA (Vision-Language-Action)

Architektur-Klasse für Roboter-Foundation-Models. Das Modell sieht Bilder, versteht Sprach-Anweisungen und leitet daraus Bewegungen ab. GR00T, Helix, π0 sind alle VLA-Modelle.

W

World Model

KI-Komponente, die eine interne Simulation der Welt vorhersagt — "was passiert als Nächstes?". NVIDIAs DreamZero (Teil von GR00T N2) ist ein prominentes Beispiel. Ermöglicht vorausschauende Aktionen.

Was ist der Unterschied zwischen Physical AI und Embodied AI?

Praktisch keiner — beide Begriffe bezeichnen KI-Systeme, die in einen physischen Körper (meist einen Roboter) eingebettet sind. Physical AI ist der von NVIDIA seit 2024 prominent genutzte Marketing-Begriff. Embodied AI ist der ältere, akademisch geprägte Begriff. Die Bedeutung ist identisch.

Was ist ein VLA-Modell?

Ein Vision-Language-Action-Modell ist ein neuronales Netz, das gleichzeitig Bilder sehen, Sprach-Anweisungen verstehen und daraus Roboter-Bewegungen ableiten kann. Beispiele: NVIDIA GR00T, Figure Helix, Physical Intelligence π0, Google Gemini Robotics. VLA ist die Standard-Architektur für moderne humanoide Roboter 2026.

Was bedeutet 'Human-in-the-Loop'?

Ein Design-Prinzip, bei dem ein Mensch per Teleoperation einspringt, wenn die KI des Roboters überfordert ist. 1X Technologies nutzt das bei NEO explizit — wenn NEO eine unerwartete Situation trifft, übernimmt ein Operator via VR-Headset. Kritiker nennen das 'nicht wirklich autonom', Befürworter einen pragmatischen Brücken-Ansatz zur echten Autonomie.

Was ist ein Foundation Model für Roboter?

Ein großes vortrainiertes neuronales Netz, das als Basis für viele verschiedene Roboter-Aufgaben dient — analog zu GPT-4 oder Claude für Text. Der entscheidende Sprung: Ein Roboter mit Foundation Model braucht nicht für jede Aufgabe einzeln programmiert werden, sondern kann auf Anweisung reagieren.

KI-Glossar — Physical AI erklärt.

A

C

D

E

F

G

H

I

J

L

P

R

S

T

V

W

Häufige Verständnis-Fragen