Die sieben dominierenden Klassen im Profil
Vision-Language-Action-Models
End-to-End-Policy-Networks
Hierarchical Reinforcement Learning
Diffusion-Policies
Behavior-Cloning
Model-Predictive Control + ML-Heuristik
Reinforcement-Learning + Sim-to-Real
In der Praxis ist der Stack hybrid.
Eine moderne humanoide Robotik-Plattform 2026 nutzt selten eine einzige Architektur. Typische Kombinationen: VLA als High-Level-Planer + Diffusion-Policy als Action-Decoder + klassischer MPC als Low-Level-Whole-Body-Controller. Locomotion läuft häufig vollständig über Sim-to-Real-RL, während Manipulation auf VLA mit Behavior-Cloning-Phase basiert.
Wer die einzelnen Modelle namentlich vergleichen möchte, findet im Foundation-Models-Dossier die League-Table aller relevanten VLAs. Wer die zugrunde liegende Hardware verstehen will, findet im Hardware-Stack die vollständige Schichtenübersicht.