Meta推出AI视觉模型，利用可编程语言实时预测建立3D场景

huahua 发表于 2024-3-26 11:40

　　据Meta公司官方新闻稿，该公司开发了一款名为“SceneScript”的视觉模型，该模型号称能够使用可编程语言来快速“建立”场景，实时推断房间几何形状，并将相关数据转换为建筑学层面的近似值。Meta声称，相关方法能够高效且轻量地建立室内3D模型，号称“只需要数KB的内存即可生成清晰且完整的几何形状”，并且相关形状数据具有“可解释性”，用户可以轻松阅读和编辑这些数据表示。开发人员借鉴了大语言模型“预测单词”的方法来开发SceneScript，以Llama模型为例，该模型可以根据前面的单词来预测句子的下一个单词，例如输入句子“The cat sat on the…”，模型会预测下一个单词可能是“mat”或“floor”。而SceneScript运用了相同的概念，即通过前序输入内容推出后文，并使用这些建筑学层面的描述重建出复杂的室内3D环境。（IT之家）
　　http://www.shangcaiyou.com.cn
　　http://www.chcon.com.cn

页: [1]

肥猫SEO论坛's Archiver

Meta推出AI视觉模型，利用可编程语言实时预测建立3D场景