World Labs发布实时生成式世界模型RTFM,李飞飞创业新里程碑
李飞飞创立的World Labs发布了实时生成式世界模型RTFM,该模型具备实时生成和模拟现实世界的能力,可广泛应用于虚拟现实、增强现实、智能机器人等领域,RTFM模型的发布标志着人工智能技术在模拟现实世界方面的又一重要进展,有望为相关领域带来革命性的变革,摘要字数控制在100-200字以内。



由斯坦福大学教授李飞飞联合创办的初创公司 World Labs 近日推出了全新的实时生成式世界模型 RTFM(Real-Time Frame Model),宣称该模型具备实时运行、持续演化以及保持3D一致性的能力,其突出优势在于仅需一块H100 GPU即可流畅运行。
RTFM 采用自回归扩散Transformer架构,通过对海量视频数据进行端到端训练,无需依赖显式的3D建模流程,便能生成多视角的2D图像,并自然模拟出反射、阴影等复杂物理现象。该模型支持从少量稀疏照片中重建真实场景,结合空间记忆机制与上下文调度技术,有效维持场景的长期一致性与时空连贯性。
核心优势
- 仅需单颗H100 GPU即可实现交互式画面的实时渲染,帧率稳定,显著降低计算开销——例如生成一小时4K视频所需处理的token量超过一亿,远优于传统方法。
- 模型设计围绕高效性、可扩展性与持久性三大理念构建,未来可通过增加算力进一步拓展模型规模。
李飞飞团队指出,后续将重点提升RTFM在动态场景建模和用户交互方面的能力,更大参数量版本的模型有望带来更强大的表现力与应用潜力。
模型官网:https://www.php.cn/link/99f4a5fef7b45624924eb900758be690
网友留言(0 条)