微信公众号

VR陀螺微信公众号

手机端

手机端扫码访问

深度报告

推广

推广

推广

推广

AI

微软展示VASA-1，通过单一肖像图和语音生成数字人视频

发布时间：2024-04-19 12:03 | 标签：微软 AI AI数字人 VASA-1

转载来源：微软

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

编译/VR陀螺

微软发布VASA-1，官网介绍道：只需使用单张人物肖像照片+一段语音音频，即可实时生成高仿真的数字人讲话视频，唇部动作、面部动作和头部运动都与音频内容同步，其表现高度自然协调。

微软表示，这是一个新的框架，可以在给定单张静态图像和语音音频的情况下，生成具有吸引人的视觉情感技能（VAS）的逼真的虚拟数字人说话视频。

从微软的演示来看，不仅提供具有逼真的面部和头部动态的高质量视频，而且还支持高达40 FPS的在线生成512x512尺寸视频，并且启动延迟（前期延迟仅为170ms）可以忽略不计。这项技术为与模仿人类对话行为的逼真数字人进行实时互动提供支持。

在示例中可以看到更多基于1分钟语音音频生成的视频，以及输入不同音频生成的10~15秒的视频，既可以让蒙娜丽莎唱Rap，又能让素描人像念华强台词，数字人的外观并不局限于性别、年龄、口音以及种族。

所有微软展示的VASA-1的肖像图像都是由StyleGAN2或DALL·E-3生成的虚拟的、不存在的身份（蒙娜丽莎除外）。

VASA-1能够做到实时渲染，对比目前市面上的同类产，VASA-1效果最好。考虑到相关技术的风险性，目前该模型只是作为研究预览展示，研究重点是为数字人生成提供视觉情感的积极应用，仅供微软研究团队的人员使用，并不对外开放，也没有产品以及API发布计划。

来源：微软

投稿/爆料：tougao@youxituoluo.com

稿件/商务合作：林南（微信 19250561593）六六（微信 13138755620）

加入行业交流群：林南（微信 19250561593）

元宇宙数字产业服务平台

下载「陀螺科技」APP，获取前沿深度元宇宙讯息

上一篇： 《狙击精英》衍生系列《丧尸军团》将推出VR游戏，2024年内发售

下一篇： 61届高博会圆满结束，大朋VR多项解决方案成大会焦点

你可能感兴趣的文章：

TeamViewer将Windows AI API集成至Assist AR，优化远程协作体验

微软正在测试一款面向办公室工作人员的可穿戴人工智能设备

莫界与微软深圳出海中心达成战略合作，全链路赋能AI+AR国际化布局

2025年游戏行业裁员人数略有下降，超过9100人

微软新专利：智能眼镜在正前方集成眼动追踪模块

微软已向Quest的Windows 11用户开发Mixed Reality Link功能

热门文章排行: 1 传Snap拟1亿美元股权签约小罗伯特·唐尼，为Specs代言

2 58° FOV、骁龙8 Elite Gen 5，AIOS，一文看懂 Rokid Open Day 2026

3 受内存存储成本上涨影响，苹果M5 Vision Pro售价上调200美元

4 《Ghosts Of Tabor》开发商Combat Waffle Studios宣布裁员

5 Innovative Eyewear携手Encore Optical，拓展Lucyd AI眼镜配镜服务

6 雷鸟iO首秀：单绿色显示方案，搭配波士顿框设计

7 理湃光晶完成B+++轮融资，加速建设百万套级AR光学组件生产基地

8 单眼4K、AI Agent几小时搭出3D应用，PICO Swan再曝底牌

9 苹果公司Vision Pro和AI眼镜项目负责人跳槽至OpenAI

10 AltaVR宣布VR游戏《小镇传奇》将于7月停服

推荐专题

VR/AR 2025年度专题更多


2025年度备受关注的十大XR技术 | 年度专题
CES2026 更多


30克只是起点：瑞声科技谈AR眼镜的重量、功能与未来形态
深度 | 全面解读AI眼镜更多


下一代 AI 眼镜正在「悄悄」涨价
陀螺研究院XR产业报告更多


9款新品，近6亿融资，《2026年5月VR/AR与AI眼镜行业月报》发布
苹果Vision Pro开发教程更多


Vision Pro中文开发教程系列视频汇总（全73课）
Vision Pro精选内容推荐更多


Vision Pro精选内容每周推荐：Sandblox、Amplium、Travel Immersive
苹果空间计算专题更多


苹果宣布将为Vision Pro推出首部长篇沉浸式纪录片
硬件专业评测更多


亮亮视野 Leion Hey2 评测：专注语音翻译，用 8 小时真实续航换来的取舍之道
XR行业应用案例集更多


陀螺研究院XR行业应用案例集｜基于穿戴式柔性手部动捕设备的混合现实整形外科手术教学训练一体化平台

人物专访 更多: 对话Arvore创始人：打造《黑袍纠察队》VR大作，巴西工作室冲刺3A与多平台布局 06-04

对话酷咔数字：Meta震荡期，以《Dread Meridian》向硬核玩家交出「付费体验」答卷 01-23

30克只是起点：瑞声科技谈AR眼镜的重量、功能与未来形态 01-16

依视路陆逊梯卡：年产能计划提升至2000万副，大量AI眼镜新品正在路上 11-27

对话《夜店模拟器》制作人：从1人开发，到50万下载的实战心得 11-06

对话法国团队VIRTUAL BEINGS：如何用「行为AI引擎」打造跨平台虚拟宠物？ 10-30

不止于大空间：《道诡异仙VR》如何用“实景置景”打通线下沉浸式闭环？ 10-22

对话三体宇宙：故事沉浸、技术突破和线下布局，科幻IP的VR自制之路 10-21

对话英兔软件：穿越VR行业九年周期，1款新品、2条业务线与3个生存法则 09-25

对话灵犀微光郑昱 | Meta新款眼镜选择阵列光波导，这意味着什么？ 09-24

数据报告 更多: 9款新品，近6亿融资，《2026年5月VR/AR与AI眼镜行业月报》发布 06-11

AI眼镜大战升级，40家核心芯片厂商一览｜2026年最新产业图谱 05-25

VR游戏周报丨Valve公布4月SteamVR硬件数据；Quest月活超百万游戏《Animal Company》登陆Steam 05-22

22家！AI眼镜传感器厂商一览｜2026年最新产业图谱 05-15

2026年4月VR/AR行业月报丨VR陀螺 05-12

2026年3月VR/AR行业月报丨VR陀螺 04-13

陀螺研究院发布《2025全球VR/AR产业发展报告》 04-01

2026年2月VR/AR行业月报丨VR陀螺 03-11

洛图科技：2025年中国智能眼镜市场销量145.4万台 03-05

陀螺研究院发布《2025年度XR大空间产业报告》 01-31

融资并购 更多: 索尼影业向VR线下体验馆运营商Cosm注资1亿美元，并获少数股权 06-25

创想数维完成2010万元Pre-A+轮融资，加速AI+XR产业化落地 06-03

IPO前夜，Rokid狂飙 06-03

VTuber应用《Avvy》的运营商AnotherBall宣布获得25亿日元债务融资 05-20

韶音、光峰参投，主打“智能变焦眼镜”的众见科技完成数千万元融资 05-18

Phosio获400万美元融资，将用于投建低成本高性能AI眼镜镜片生产线 05-14

VR医疗创企Floreo获克利夫兰诊所100万美元投资，其VR自闭症疗法将接受美国FDA审评 04-21

德国VR心理健康技术创企brainjo完成200万欧元种子轮融资 04-21

AR光学方案商「鲲游光电」完成近4亿元C+轮融资 04-10

INAIR完成千万美元A+轮融资 04-10

官方微信账号:
VR陀螺

加入行业社群