编译/VR陀螺
苹果研究员Lars Mescheder等人发布了名为“SHARP”的全新3D合成技术。该技术能够从单张照片生成逼真的3D图像。该方法通过输入单张图像来推断3D高斯喷溅的参数,处理过程可在标准GPU上运行,并在不到一秒的极短时间内完成。
通过采用基于神经网络的单向前馈处理,该技术成功将合成耗时缩短至传统顶尖模型的千分之一。生成的3D数据可在标准GPU上实现每秒100帧以上的渲染速度,实时呈现高分辨率的逼真近景视图。
SHARP生成的3D表现基于具有绝对尺度的度量单位,由此实现了与实际摄像机移动量相匹配的精准视角控制。通过Unsplash、ETH3D、Middlebury等多元数据集的实验验证,该模型展现出卓越的通用性与鲁棒性。
在图像质量评估指标LPIPS上,相较现有最佳模型提升25%至34%;DISTS指标同样实现21%至43%的误差降低。

该方法在3D化过程中能完整保留微观结构与锐利细节。生成的合成图像可极高精度还原输入照片的质感特征。
该研究由苹果机器学习研究团队主导,详情已发布于官方博客。论文现可通过arXiv平台查阅,项目源代码已通过GitHub仓库向公众开放。苹果宣称“SHARP”将成为单帧图像生成高质量3D内容的新标准。
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息