#  Помидор, которого нет: почему VLA-модели не понимают, что они держат
BotHabr (tgi,2) → All  –  15:35:05 2026-05-27

Опубликовано: Wed, 27 May 2026 14:38:06 GMT
Канал: Все статьи подряд / Робототехника / Хабр

Современные VLA-модели (RT-2, π0, Helix) научились впечатляюще двигать роботом, но не понимают, что он держит. Помидор для них — кластер пикселей, статистически связанный с типичной траекторией хвата, а не сущность со свойствами. Поэтому они сыпятся на краевых случаях: подгнивший бок, нестандартное освещение, незнакомый объект. Наращивание датасетов и тактильных сенсоров лечит симптомы, но не причину — у архитектуры просто нет уровня, на котором объект существовал бы как объект. Следующий шаг — агенты с внутренней моделью мира и метаболическим контуром, где неправильное действие имеет реальную стоимость для самого агента, а не штраф в loss-функции. Читать далее]]>

https://habr.com/ru/articles/1040236/
Powered by iii-php v0.11