구글이 텍스트 입력만으로 가상 세계를 만드는 '프로젝트 지니'를 공개하며 시장에 파장을 일으키자, 메타버스 플랫폼 로블록스도 '4D 생성 기능'을 발표하며 맞대응했습니다. 이 기능은 텍스트 프롬프트만으로 실제 작동 가능한 객체를 생성하며, 기존 3D 모델에 '시간'과 '동적 기능'을 더해 사용자가 생성한 객체가 게임 내 물리 법칙에 따라 즉각적으로 반응하고 작동하도록 합니다.
이 기술의 기반이 되는 '큐브' 모델은 로블록스 내 350만 개 이상의 자산을 학습하여 3D 데이터를 텍스트처럼 이해하고 예측합니다. 특히 고성능 GPU 환경에서 추론 파이프라인을 최적화하여 생성 속도를 획기적으로 단축했습니다. 발표된 데이터에 따르면 3D 모델 생성 시간이 기존 31초에서 4초로, 토큰 생성 지연 시간은 60.5밀리초에서 7.8밀리초로 줄어들어 실시간에 가까운 반응성을 확보했습니다.
로블록스는 이 기술이 실제 게임에서 어떻게 구현되는지 구체적인 사례를 공개했습니다. 예를 들어, 사용자가 '운전 가능한 오렌지색 스포츠카'라고 입력하면 AI는 바퀴가 굴러가고 조향 장치가 작동하며 물리 엔진의 영향을 받는 '기능하는 탈것'을 즉석에서 생성합니다. 또한, 생성된 객체의 크기에 맞춰 스크립트를 재조정하는 단계를 포함하여 크기가 다른 부품도 의도대로 작동하게 만듭니다.
로블록스는 이번 기술의 핵심 API를 개발자들에게 공개하여 실무적인 활용 가능성을 강조했습니다. 더 나아가 단순한 사물을 넘어 마을이나 숲 같은 '전체 장면(Full Scene)'을 실시간으로 구현하는 '리얼타임 드리밍' 단계까지 확장하겠다는 포부를 밝혔습니다.
이러한 발표는 구글 딥마인드의 '프로젝트 지니' 공개 직후 이루어졌다는 점에서 주목받고 있습니다. '프로젝트 지니' 발표 이후 로블록스의 주가가 10% 가까이 하락하는 등 생성형 AI가 기존 게임 플랫폼의 입지를 위협할 수 있다는 우려가 제기되었습니다. 로블록스의 '4D 생성 기능' 발표는 이러한 시장의 불안을 해소하고, 구글의 비디오 기반 생성 방식과 차별화된 '엔진 기반의 생성 능력'을 증명하려는 전략적 움직임으로 해석됩니다.