ROBOTERGEHIRN.DE Dossier Nr. 03 · Q2 2026 · Hardware-Stack

Hardware-Dossier · April 2026

Vom GPU-Cluster zum Aktor — der Robotik-Hardware-Stack 2026.

Edge-Compute · Standard 2026
275 TOPS
Rechenleistung NVIDIA Jetson AGX Orin (64 GB) — derzeit verbreitetste On-Board-KI-Plattform für humanoide Roboter. Nachfolger Thor erreicht ~2.000 TOPS.
Quelle · NVIDIA Datasheets · Hersteller-Spezifikationen

Ein modernes Robotergehirn ist nicht nur Software. Damit ein Foundation-Model auf einem humanoiden Roboter überhaupt laufen kann, braucht es einen vollständigen Hardware-Stack — von Inferenz-Beschleunigern auf der Brust des Roboters über Sensor-Fusion-Boards und Echtzeit-Mikrocontroller bis hin zu den Aktoren selbst, die am Ende die Bewegung erzeugen.

Dieses Dossier verfolgt die Datenkette von oben nach unten: Edge-Compute, Sensorik, Echtzeit-Betriebssystem, Servomotor-Klassen und taktile Sensoren. Der Stack 2026 ist überraschend NVIDIA-zentriert; die Bewegung Richtung dedizierter Robotik-SoCs hat aber begonnen.

Kapitel 01Datenkette

Schichtdiagramm — was wo läuft

Der Hardware-Stack moderner humanoider Roboter besteht aus sechs unterscheidbaren Schichten. Jede Schicht hat eine eigene Latenz, eigene Bandbreiten-Anforderungen und eigene Versorgungs- und Kühlungs-Anforderungen. Folgendes Diagramm zeigt den Standard-Aufbau, wie er bei Figure 02, Apptronik Apollo und 1X NEO 2026 in ähnlicher Form anzutreffen ist.

Schicht-Diagramm · Top-Down
L6
Foundation-Model-InferenzVLA · Diffusion-Policy
Läuft on-device auf Edge-GPU. NVIDIA Jetson AGX Orin / Thor; bei Tesla Optimus eigene FSD-Hardware-Variante.
Latenz 50 – 200 ms
↓ Sub-Goals · Trajektorien-Token ↓
L5
Sensor-Fusion-BoardVision-Encoder
Multi-Kamera-Stream (4 – 8 Kameras), Tiefe (RGB-D oder Stereo), IMU. Encoder läuft auf separater GPU oder NPU, häufig in dasselbe Modul integriert.
30 – 60 Hz
↓ Embeddings + Pose ↓
L4
Whole-Body-ControllerEchtzeit-CPU
Klassische Robotik: Inverse-Kinematics, Quadratic-Programming, Whole-Body-MPC. Läuft auf x86- oder ARM-CPU mit RT-Kernel.
200 – 1.000 Hz
↓ Soll-Drehmomente pro Achse ↓
L3
Echtzeit-BusEtherCAT · CAN-FD
Deterministischer Feldbus zwischen Controller und Servomotor-Treibern. EtherCAT typisch 1 ms Zykluszeit, CAN-FD bei niedrigerem Bandbreitenbedarf.
1 ms Zyklus
↓ Drehmoment-Sollwerte ↓
L2
Servomotor + TreiberAktor-Loop
Brushless-DC-Motor mit harmonischem oder zykloidem Getriebe; lokaler Field-Oriented-Control-Loop im Treiber, regelt Strom und Position.
Stromregler 16 kHz
↓ Bewegung · Gelenkmoment ↓
L1
Sensorik am AktorForce-Torque · Tactile
Sechsachsige Force-Torque-Sensoren am Handgelenk; visuotaktile oder kapazitive Sensoren in den Fingerspitzen. Feedback zurück nach L4 / L5.
100 – 1.000 Hz
Kapitel 02Edge-Compute

Edge-Compute — wo das Foundation-Model wirklich läuft

Foundation-Models müssen 2026 on-device laufen. Ein VLA per Cloud-Inferenz zu betreiben ist für Robotik wegen Latenz und Verfügbarkeit nicht praktikabel. Damit wird Edge-Compute zum kritischen Engpass: ein Modell mit 7 Mrd Parametern braucht selbst quantisiert mehrere Gigabyte VRAM und Inferenz-Zeiten unter 100 ms — auf einem System, das gleichzeitig Wärme, Stromverbrauch und Gewicht im Griff halten muss.

PlattformRechenleistungSpeicherTDPTypischer Einsatz
Jetson Orin Nano 40 TOPS 8 GB LPDDR5 7 – 15 W Mobile Roboter, Forschungs-Setups, kleine Cobots
Jetson AGX Orin (32 GB) 200 TOPS 32 GB LPDDR5 15 – 40 W Aktuelle humanoide Plattformen mittlerer Klasse
Jetson AGX Orin (64 GB) 275 TOPS 64 GB LPDDR5 15 – 60 W Standard 2025-26 für VLA-Inferenz on-device
Jetson Thor ~2.000 TOPS (FP4) 128 GB LPDDR5X 40 – 130 W Nächste Generation Humanoid; Roll-out 2025-26
Tesla FSD-Compute (custom) ~144 TOPS / Chip proprietär ~36 W Tesla Optimus (modifizierte FSD-Variante)
Kapitel 03Software

Echtzeit-OS und Middleware

Das De-facto-Standard-Betriebssystem in der Robotik 2026 ist Linux, oft mit Echtzeit-Erweiterung. Die zwei dominierenden Konfigurationen sind PREEMPT_RT-gepatchter Linux-Kernel (offiziell seit Kernel 6.12 als Standard-Build möglich) und Xenomai/RTAI für harte Echtzeit-Anforderungen. Auf Anwendungsebene läuft ROS 2 (Humble, Iron, Jazzy) als Middleware — der vollständige Wechsel von ROS 1 auf ROS 2 ist 2024 weitgehend abgeschlossen.

Middleware

ROS 2 mit DDS-Backend

Quality-of-Service-Profile, deterministisches Pub/Sub via Data-Distribution-Service, Composable Nodes, Lifecycle-Management. Standard-DDS-Implementierungen: Cyclone DDS, Fast DDS.

Latenz typisch < 1 ms · Multi-Process-Loops · DDS-Discovery automatisch
Kernel

Linux PREEMPT_RT

Vollständig preemptiver Kernel-Modus für deterministische Latenzen. Worst-Case-Wakeup-Latenz typisch unter 100 µs auf x86-Realtime-Hardware. Pflicht für sicherheitsrelevante Whole-Body-Control-Loops.

Mainline seit 6.12 · Worst-Case-Latency < 100 µs
Sim-Stack

Isaac Sim · MuJoCo · Genesis

NVIDIA Isaac Sim als visueller Foto-realistic-Simulator und Trainings-Umgebung; MuJoCo (DeepMind) als physikalisch genauer Manipulations-Simulator; Genesis (CMU/MIT, 2024) für GPU-parallel beschleunigte Massenexperimente.

Sim-to-Real-Schleife · Domain-Randomization · GPU-parallel
Inferenz

TensorRT · CUDA-Graphs · LLM-Quantisierung

Foundation-Models werden für Edge-Inferenz auf INT8 / FP4 quantisiert, TensorRT-Engines werden für Jetson-Plattformen kompiliert. Faktor 2 – 4 Geschwindigkeitsgewinn ohne nennenswerten Genauigkeitsverlust.

INT8-Standard · FP4 ab Thor · LoRA-Adapter ladbar
Kapitel 04Aktorik

Servomotor-Klassen und Force-Sensorik

Auf der Aktor-Seite stehen humanoide Roboter vor einer harten Optimierungsaufgabe: Drehmoment, Geschwindigkeit, Gewicht und Reaktivität (Backdrivability) widersprechen sich. Drei Aktor-Klassen dominieren 2026.

Klasse 1

Quasi-Direct-Drive

Brushless-DC-Motor mit niedrigem Übersetzungsverhältnis (typisch 6:1 bis 12:1). Hochdynamisch, gut backdrivable, keine Force-Torque-Sensoren nötig — Drehmoment wird aus dem Strom geschätzt. Pionier: MIT Cheetah, später Unitree, jetzt in vielen Humanoid-Beinen.

Reaktivität sehr hoch · Strom-basierte Kraftschätzung · TQ-Estimation aus Stromsensor
Klasse 2

Harmonic Drive (Wellgetriebe)

Hochpräzise Getriebe mit Untersetzungen 50:1 bis 160:1, sehr geringes Spiel. Standard in industrieller Robotik (Fanuc, ABB, Yaskawa) und in Armen vieler Humanoide. Hersteller: Harmonic Drive Systems (Japan), Leader Drive (China).

Backlash < 1 arcmin · Hohe Steifigkeit · Geringe Backdrivability
Klasse 3

Cycloidgetriebe (Nabtesco RV)

Hohe Drehmomentdichte und Stoßfestigkeit. Üblich in Schwerlast-Industrierobotern und in Hüft-/Knie-Gelenken großer Humanoide (z. B. Boston Dynamics Atlas Electric).

Drehmomentdichte hoch · Untersetzung 30:1 bis 250:1 · Geringe Reaktivität
Sensorik

Force-Torque + visuotaktile Fingerspitzen

Sechsachsige Force-Torque-Sensoren (ATI, Robotous, Bota) am Handgelenk für Manipulationsaufgaben. In den Fingerspitzen: visuotaktile Sensoren (GelSight, DIGIT, AnySkin) oder kapazitive Arrays. Liefern lokales Kraft- und Slip-Feedback an die Policy.

FT-Sensor 6-DOF · Visuotaktil ~50 Hz · Slip-Detection < 10 ms
Hardware-Engpass 2026

Edge-Compute ist derzeit der harte Engpass — nicht das Modell.

Trotz Fortschritten bei der Modell-Effizienz bleibt die Inferenz-Latenz auf On-Board-Hardware der wichtigste Begrenzungsfaktor. Ein 7-Mrd-Parameter-VLA braucht selbst auf Jetson AGX Orin (64 GB) typisch 80 – 150 ms pro Inferenz-Schritt — schnell genug für Sub-Goal-Planung mit 5 – 10 Hz, aber zu langsam für direkte Manipulation. Daher die Hybrid-Stacks mit langsamer System-2-Reasoning-Schicht und schnellerer System-1-Action-Schicht (z. B. Helix).

Mit Jetson Thor (ab 2025-26 in Serie) verschiebt sich der Engpass: 2.000 TOPS und 128 GB Speicher ermöglichen größere Modelle und Multi-Modell-Pipelines on-device. Erst damit werden VLAs jenseits 10 Mrd Parameter on-board praktikabel — ein Meilenstein für die Wave-2028-These.

Weiterlesen