全面碾压 GPT-4!谷歌 Gemini AI 上手测试视频:能力逆天
- 爱奇艺限时半价 | 30+正版软件打折 | PD 虚拟机 7 折 | RackNerd 黑五 | 京东 Plus ¥69
今日,谷歌官方正式发布了名为 Gemini 的超级 AI 大模型!这是迄今为止 Google 构建的最强大、最通用、最灵活的多态模型,能力甚至能“碾压”目前 ChatGPT 最强的 GPT-4。这也是「Google Bard」问世以来最大的一次更新。
Gemini (双子星) 是一个多模态大模型,意味着它可以泛化并无缝地理解、操作和组合不同类型的信息,包括文本、图片、代码、音频、和视频,从官方发布的实测效果来看相当的震撼!
相当震撼!谷歌 Gemini 上手测试视频:
下面是一段演示视频,对 Gemini 进行了全方位的测试,从正常对话、视图能力、逻辑推理能力、语言翻译能、图像生成能力等可以看到,其实力简直逆天!
谷歌表示,Gemini 1.0 经过训练,可以同时识别并理解文本、图像、音频等多种形式的信息,因此它能更好地理解那些细微差别的信息,并回答与复杂主题相关的问题。尤其在解释数学和物理等复杂科目中的推理方面,它表现得尤为出色!
Gemini 模型根据不同的使用场景分为三个版本:
- Gemini Ultra:规模最大、功能最强大的模型,适用于超级复杂的任务。
- Gemini Pro:适用于各种通用任务的最佳模型。
- Gemini Nano:适用于手机等设备的高效模型。
其中,视频演示是基于 Gemini Ultra 的,但目前 Google 还在测试阶段,未对公众开放。而集成到 Google Bard 上的将会是 Gemini Pro,能力大概是 ChatGPT 3.5 的水平。而 Gemini Nano 则更加有趣,它专为小型设备设计,是一款可运行在手机上的 AI 大模型!未来将会集成在 Google Pixel 手机系列里面。
基准测试结果:
根据谷歌公布的基准测试结果来看,Gemini 在与 OpenAI 的 ChatGPT 的 GPT-4 模型对比时展现出了非常强大的性能。除了 HellaSwag 数据集外,Gemini 在其他基准测试中都全面领先 GPT-4。
在 32 个广泛使用的学术基准测试中,Gemini Ultra 有30个超过了当前最领先水平,更令人惊叹的是,在 MMLU(大规模多任务语言理解)测试中,Gemini Ultra 以 90.0% 的分数成为第一个超过人类专家的模型(这个测试结合了数学、物理、历史、法律、医学和伦理等 57 个科目)。
同时,在 MMMU 基准测试中,Gemini 也取得了 59.4% 的分数,这个测试涵盖了多领域的多模态任务,需要仔细推理。相比之前的 AI 只凭第一印象去回答问题,Gemini 会有明显的思考,得分表现也有了明显的提升。
总的来说,根据上面的视频测试看了,Gemini 确实非常强大!只希望这个能力不是播片效果,实装之后能给人工智能业界带来新的震撼吧。
/ 关注 “异次元软件世界” 微信公众号,获取最新软件推送 /
如本文“对您有用”,欢迎随意打赏异次元,让我们坚持创作!
赞赏一杯咖啡