Стартап Overworld, созданный выходцами из компании Stability AI, представил свою модель Waypoint-1, которая генерирует интерактивные 3D-окружения в реальном времени. В отличие от традиционных процедурных генераторов, эта система реагирует на действия игрока с клавиатуры и мыши, позволяя свободно перемещаться по миру, который формируется на лету.
Модель Waypoint-1 основана на видео-диффузионном трансформере, содержащем 2,3 миллиарда параметров. Обучение проводилось на основе 10 тысяч часов записей игрового процесса, что позволило системе усвоить как визуальные паттерны, так и основы игровой логики. Для поддержания связности мира во время длительных сессий применяется уникальный метод стабилизации, известный как self-forcing via DMD, который предотвращает визуальные скачки и распад сцены.
Разработчики утверждают, что на видеокарте уровня RTX 5090 модель обеспечивает стабильные 30 кадров в секунду, что открывает перспективы для использования технологии в играх, VR-приложениях и симуляторах. Waypoint-1 доступна для скачивания на Hugging Face, и хотя в первую очередь она предназначена для исследователей и экспериментаторов, ее появление указывает на переход к динамическим среды, адаптирующимся под действия пользователей.
tasani.ru