今日谷歌在其I/O大会期间,宣布了自家AI大模型矩阵的更新以及迭代情况,主要信息如下:
新增Gemini 1.5 Flash
谷歌表示,1.5 Flash是目前速度最快的Gemini模型,它专门针对大规模的大批量、高频任务进行了优化,服务更具成本效益。
据悉,1.5 Flash基于Gemini 1.5 Pro“distillation”(译为蒸馏)训练而来,它能将较大模型中最重要的知识和技能转移到更小、更高效的模型中。
1.5 Flash的负载要比1.5 Pro小得多,但是在内容生成方面同样有不俗的质量表现。1.5 Flash擅长摘要、聊天应用程序、图像和视频字幕、从长文档和表格中提取数据等。
1.5 Pro性能提升
目前1.5 Pro最为显著的提升在于它的信息处理能力由100万token提升至了200万token。
此外,谷歌表示该大模型还进一步提升了其代码生成、逻辑推理和规划、多轮对话以及音频和图像理解能力,目前可以执行更加复杂和细致的指令。
其他方面,Gemini API和Google AI Studio中新增了音频理解能力,可以对上传视频的图像和音频进行推理。当然,现如今1.5 Pro也更为紧密地与谷歌旗下产品结合在了一起。(这也是本次I/O大会核心展示部分)
Gemini Nano
Gemini Nano是一款适用于智能手机等设备的端侧大模型,早些时候该大模型只支持纯文本处理,现如今已经进一步升级图像处理功能。Gemini Nano目前已经应用于Pixel等手机产品当中。
开放模型Gemma 2
推出开放大模型Gemma 2,该模型采用全新架构,相较老版本性能以及效率有所升级,并且新增了不同尺寸版本。
Project Astra
Project Astra旨在成为下一代AI助理,具有多模态能力,用户能够与之进行复杂的对话。谷歌在I/O大会期间展示了基于Project Astra所构建的体验视频,里面包含了Project Astra与AR眼镜相集成的用例。
来源:谷歌
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息