文/VR陀螺 万里
AI眼镜目前可谓是明星AI硬件产品,一众企业下场,Ray-Ban Meta销量爆火并受到了很多瞩目。
由于AI眼镜还属于一个新兴品类,背后仍有很多有待挖掘的需求。本文将聚焦于一些AI眼镜开发者以及极客玩家,并从中一窥这些用户为眼镜所构建的创新用例。
封闭的Ray-Ban Meta,如何获得第三方应用体验?
Ray-Ban Meta无疑是AI眼镜市场的典型代表,销量已经破两百万,产品主打第一视角拍照/录像、AI以及音乐播客功能,这些功能获得了普通消费者的众多好评。但另一边,Ray-Ban Meta系统偏封闭,直到现在Meta都没有对外推送相应的SDK,这导致了开发者无法为这款设备开发更多第三方应用。
即便如此,市面上还是出现了一些绕过Ray-Ban Meta硬件权限从而实现软件开发的案例。去年曾有两名哈佛学生基于Ray-Ban Meta实现了自动获取陌生人姓名、家庭住址、电话号码以及亲属姓名等功能。由于这背后涉及到了与每个人息息相关的隐私安全问题,当时还引起了一阵社会热议。
前面提到,Ray-Ban Meta并未向开发者开放眼镜的摄像头权限,他们之所以能够实现这一点,实际上是用了一个讨巧的解决方案:Ray-Ban Meta支持通过Facebook、Instagram等社交平台直播,因而可以设计一款检测直播流画面的软件。当AI识别相应的人脸信息后便可通过眼镜的蓝牙输出语音反馈。(Ps:Ray-Ban Meta支持单次直播时长为30分钟)。
图源:X
除了相机权限外,Ray-Ban Meta第三方大模型的缺失也是很多用户的一大遗憾。目前该设备运行的是自家的Meta AI,但暂不支持ChatGPT、Gemini等其他主流AI工具。
曾有用户对比了Meta AI与ChatGPT的AI能力,他认为ChatGPT在分析图像时很细致,并且回复问题时可以做到更加全面,错误率更低。而Meta AI回复内容会相对简练,这可能对于语音交互会相对友好。在这种情况下,为Ray-Ban Meta引入ChatGPT想必能够一定程度改善使用体验并丰富用户的选择面。
注:对比方式为记录Meta AI的后台图片反馈,并将相同的图片传到ChatGPT进行处理。
图源:Medium
所幸的是,对于Ray-Ban Meta的第三方AI调用问题,市面上也出现了一些解决方案。
其中最简单的方式莫过于将Ray-Ban Meta充当为蓝牙耳机使用,手机端打开第三方AI大模型的Live模式,然后就可以进行对话了。
如果想要更进一步,我们可以参考来自Medium用户Gorjan Jovanovski的解决方案:
该方案可以顺利实现Ray-Ban Meta对于ChatGPT的调用,但是局限在于整个链路较长使得时延会明显增加。
值得一提的是,对于国内AI眼镜,它们的AI大模型的选择面以及丰富性简直完爆Ray-Ban Meta。很多硬件厂商试图发挥中台一类的角色,并通过接入各类模型以满足用户的不同需求。
如果再延伸来看,笔者认为后续AI眼镜可能会分为两类:模型厂商、硬件厂商,它们产品的AI能力将会是封闭与开放的两个代表。
开放式AI眼镜崭露头角,开发者构建了哪些内容?
虽说当前AI眼镜多以封闭为主,但市场上也已经出现了一些主打开放的操作系统:
Android XR:这是一个由谷歌打造的AR/MR系统,发布于去年12月,后续将会搭载于谷歌、XREAL等眼镜新品当中。由于该系统仍属于早期,目前暂未发现有相应的眼镜SDK发布。
Snap OS:Snap曾于去年九月发布了AR眼镜新品Spectacles 5,并同步推出了Snap OS以及Lens Studio开发工具,眼镜聚焦于部分国家的内容开发者,设备订阅价格为99美元/月 (美国)/110欧元/月(欧盟)。
图源:Snap
Project Aria:这是一个Meta推出的AI眼镜研究项目,已经累计发布两代硬件产品,并对外开放了相应的研究套件,根据官网信息,产品主要面向“探索机器感知技术或其应用的研究人员”。
AugmentOS:这是一个开源操作系统,由去中心化社区构建而成,该系统已经应用于Even Realities G1、Vuzix Z100、Mentra Mach1等产品,开发者可以购买相应的设备进行内容开发。
据介绍,AugmentOS是一个基于云的操作系统,云端会接收并处理眼镜端的数据,第三方APP则可以“外挂”于这个系统之上,这样能够有效简化应用开发流程。
图源:AugmentOS
Brilliant Labs:这是一家开源AR眼镜开发商,去年2月曾推出了AR眼镜Frame,产品聚焦于内容开发者,并相应推出了Frame SDK开发套件。
Brilliant Labs官网信息指出,“Frame没有自己的应用启动器或传统的应用安装系统。要与他人分享您的Frame应用,请通过App Store、Google Play或开源代码库等常规分发渠道发布您的应用。”
图源:Brilliant Labs
除了以上,AR眼镜厂商雷鸟创新、Rokid、星纪魅族、影目、XREAL等也曾对外推送了AR眼镜SDK,这里不再进一步赘述。
虽说以上所提到的这些轻量化AI/AR眼镜以及操作系统仍属于初期阶段,不过即便如此,还是有不少开发者在此基础之上构建了不少应用内容。以下是笔者在社区论坛找到的部分案例。
下图中,名为@Lucas Builds The Future的YouTuber基于Frame开发出了一款具有全天候记忆能力的AR眼镜应用。它的工作原理是眼镜每十五分钟拍摄一张照片,而后照片信息将会交由AI处理并形成类似于日记本的数据。
后续如果用户有需要,则能够根据这些信息回溯曾经所做过的事情,如快速想起“上周三的下午去了哪些地方”。
在笔者看来,设法补齐AI眼镜的“记忆”能力,会是一个长期的方向,同时这也是我最为期待的功能之一。@Lucas Builds The Future的低成本解决方案让我们提前看到了未来。
图源:YouTube @Lucas Builds The Future
此前分体式AR眼镜的一大卖点在于可以连接无人机从而实现FPV飞行,现如今,开发者David K.更进一步,基于Frame实现了对宇树机器狗Go 1的控制。
如下图所示,AR眼镜屏幕会显示当前机器狗所看到的画面,然后玩家可以基于手势让机器狗前后左右转向,并实现击落纸杯等操作。当然,由于Frame的显示分辨率不佳(640x400,彩色OLED屏幕),这是阻碍体验的一环。
David K.在介绍中指出,Brilliant Frames通过低功耗蓝牙 (BLE) 进行通信,每个像素4位,最多可渲染16种颜色。在这种资源受限的环境中,图像质量和色彩之间总是需要权衡取舍。”
图源:Linkedin @David K.
同样基于Frame平台开发,开发者CitizenOne开发了一款让人有点摸不着头脑的应用:眼镜可以检测眼前的物品并辨别究竟是不是热狗。
提到AR滤镜,这几乎已经成为了Snap的代名词。实际上,自从Spectacles 5发布以来,再配备Snap的一些激励计划,平台已经吸引了不少开发者并为之构建了很多优质AR滤镜内容。
以下是个人比较喜欢的一个投篮AR滤镜,它可以显示投篮轨迹以及记录分数。
图源:Snap
今年年初,AugmentOS举行了一场黑客马拉松活动,开发者@Philippe实现了AR眼镜屏幕实时显示取景框、基于手势实现拍摄/画面缩放等功能。
早些时候,AI/AR眼镜只能拍摄特定画面,如果需要调整参数规格则需要通过APP进行处理,后续引入手势可能会是一个提升体验的方式。
图源:X平台用户 Philippe
程序员Roger开发了一款“脏话罐”APP,它的玩法很简单,当设备检测到用户正在说某些不文明用语时,屏幕会自动弹出警告信息。(AI眼镜界的手工耿)
图源:X平台用户 Roger
目前一体式AR眼镜多会倾向于采用Micro-LED屏幕,而它在画面色彩以及分辨率等方面还不足以支撑游戏、视频等体验,因而这两项功能会被很多人下意识忽略。即便如此,一些开发者依旧试图探索这方面的可能性。
下图中,开发者Kevin实现了在单色Micro-LED屏幕的AR眼镜中播放《Bad Apple》。
图源:X平台用户 Kevin
开发者Abeer Vaishnav则成功实现了在AR眼镜运行Chrome浏览器经典的恐龙小游戏,它需要通过点击镜框进行操作。
图源:X平台用户 Abeer Vaishnav
写在最后
AI/AR眼镜仍处于早期阶段,不过从开发者的响应来看,产品的硬件并不能局限软件的想象空间。
眼镜的性能、续航、重量不可能三角依然成立,但也希望后续产品能加速迭代,从而给消费者提供更丰富的内容生态体验。
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
版权申明:本文为VR陀螺原创,任何第三方未经授权不得转载。如需转载请联系微信:vrtuoluo233 申请授权,并在转载时保留转载来源、作者以及原文链接信息,不得擅自更改内容,违规转载法律必究。文中有图片、视频素材来自互联网或无法核实出处,如涉及版权问题,请联系本网站协商处理。
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息