Schichtdiagramm — was wo läuft
Der Hardware-Stack moderner humanoider Roboter besteht aus sechs unterscheidbaren Schichten. Jede Schicht hat eine eigene Latenz, eigene Bandbreiten-Anforderungen und eigene Versorgungs- und Kühlungs-Anforderungen. Folgendes Diagramm zeigt den Standard-Aufbau, wie er bei Figure 02, Apptronik Apollo und 1X NEO 2026 in ähnlicher Form anzutreffen ist.
Edge-Compute — wo das Foundation-Model wirklich läuft
Foundation-Models müssen 2026 on-device laufen. Ein VLA per Cloud-Inferenz zu betreiben ist für Robotik wegen Latenz und Verfügbarkeit nicht praktikabel. Damit wird Edge-Compute zum kritischen Engpass: ein Modell mit 7 Mrd Parametern braucht selbst quantisiert mehrere Gigabyte VRAM und Inferenz-Zeiten unter 100 ms — auf einem System, das gleichzeitig Wärme, Stromverbrauch und Gewicht im Griff halten muss.
| Plattform | Rechenleistung | Speicher | TDP | Typischer Einsatz |
|---|---|---|---|---|
| Jetson Orin Nano | 40 TOPS | 8 GB LPDDR5 | 7 – 15 W | Mobile Roboter, Forschungs-Setups, kleine Cobots |
| Jetson AGX Orin (32 GB) | 200 TOPS | 32 GB LPDDR5 | 15 – 40 W | Aktuelle humanoide Plattformen mittlerer Klasse |
| Jetson AGX Orin (64 GB) | 275 TOPS | 64 GB LPDDR5 | 15 – 60 W | Standard 2025-26 für VLA-Inferenz on-device |
| Jetson Thor | ~2.000 TOPS (FP4) | 128 GB LPDDR5X | 40 – 130 W | Nächste Generation Humanoid; Roll-out 2025-26 |
| Tesla FSD-Compute (custom) | ~144 TOPS / Chip | proprietär | ~36 W | Tesla Optimus (modifizierte FSD-Variante) |
Echtzeit-OS und Middleware
Das De-facto-Standard-Betriebssystem in der Robotik 2026 ist Linux, oft mit Echtzeit-Erweiterung. Die zwei dominierenden Konfigurationen sind PREEMPT_RT-gepatchter Linux-Kernel (offiziell seit Kernel 6.12 als Standard-Build möglich) und Xenomai/RTAI für harte Echtzeit-Anforderungen. Auf Anwendungsebene läuft ROS 2 (Humble, Iron, Jazzy) als Middleware — der vollständige Wechsel von ROS 1 auf ROS 2 ist 2024 weitgehend abgeschlossen.
ROS 2 mit DDS-Backend
Quality-of-Service-Profile, deterministisches Pub/Sub via Data-Distribution-Service, Composable Nodes, Lifecycle-Management. Standard-DDS-Implementierungen: Cyclone DDS, Fast DDS.
Linux PREEMPT_RT
Vollständig preemptiver Kernel-Modus für deterministische Latenzen. Worst-Case-Wakeup-Latenz typisch unter 100 µs auf x86-Realtime-Hardware. Pflicht für sicherheitsrelevante Whole-Body-Control-Loops.
Isaac Sim · MuJoCo · Genesis
NVIDIA Isaac Sim als visueller Foto-realistic-Simulator und Trainings-Umgebung; MuJoCo (DeepMind) als physikalisch genauer Manipulations-Simulator; Genesis (CMU/MIT, 2024) für GPU-parallel beschleunigte Massenexperimente.
TensorRT · CUDA-Graphs · LLM-Quantisierung
Foundation-Models werden für Edge-Inferenz auf INT8 / FP4 quantisiert, TensorRT-Engines werden für Jetson-Plattformen kompiliert. Faktor 2 – 4 Geschwindigkeitsgewinn ohne nennenswerten Genauigkeitsverlust.
Servomotor-Klassen und Force-Sensorik
Auf der Aktor-Seite stehen humanoide Roboter vor einer harten Optimierungsaufgabe: Drehmoment, Geschwindigkeit, Gewicht und Reaktivität (Backdrivability) widersprechen sich. Drei Aktor-Klassen dominieren 2026.
Quasi-Direct-Drive
Brushless-DC-Motor mit niedrigem Übersetzungsverhältnis (typisch 6:1 bis 12:1). Hochdynamisch, gut backdrivable, keine Force-Torque-Sensoren nötig — Drehmoment wird aus dem Strom geschätzt. Pionier: MIT Cheetah, später Unitree, jetzt in vielen Humanoid-Beinen.
Harmonic Drive (Wellgetriebe)
Hochpräzise Getriebe mit Untersetzungen 50:1 bis 160:1, sehr geringes Spiel. Standard in industrieller Robotik (Fanuc, ABB, Yaskawa) und in Armen vieler Humanoide. Hersteller: Harmonic Drive Systems (Japan), Leader Drive (China).
Cycloidgetriebe (Nabtesco RV)
Hohe Drehmomentdichte und Stoßfestigkeit. Üblich in Schwerlast-Industrierobotern und in Hüft-/Knie-Gelenken großer Humanoide (z. B. Boston Dynamics Atlas Electric).
Force-Torque + visuotaktile Fingerspitzen
Sechsachsige Force-Torque-Sensoren (ATI, Robotous, Bota) am Handgelenk für Manipulationsaufgaben. In den Fingerspitzen: visuotaktile Sensoren (GelSight, DIGIT, AnySkin) oder kapazitive Arrays. Liefern lokales Kraft- und Slip-Feedback an die Policy.