全面碾压 GPT-4！谷歌 Gemini AI 上手测试视频：能力逆天

效果震撼网络软件 Web 2023-12-07

今日，谷歌官方正式发布了名为 Gemini 的超级 AI 大模型！这是迄今为止 Google 构建的强大、通用、灵活的多态模型，能力甚至能“碾压”目前 ChatGPT 主打的 GPT-4。这也是「Google Bard」问世以来特别大的一次更新。

Google Gemini

Gemini (双子星) 是一个多模态大模型，意味着它可以泛化并无缝地理解、操作和组合不同类型的信息，包括文本、图片、代码、音频、和视频，从官方发布的实测效果来看相当的震撼！

相当震撼！谷歌 Gemini 上手测试视频：

下面是一段演示视频，对 Gemini 进行了全方位的测试，从正常对话、视图能力、逻辑推理能力、语言翻译能、图像生成能力等可以看到，其实力简直逆天！

谷歌表示，Gemini 1.0 经过训练，可以同时识别并理解文本、图像、音频等多种形式的信息，因此它能更好地理解那些细微差别的信息，并回答与复杂主题相关的问题。尤其在解释数学和物理等复杂科目中的推理方面，它表现得尤为出色！

Gemini 模型根据不同的使用场景分为三个版本：

Gemini Ultra：规模最大、功能强大的模型，适用于超级复杂的任务。
Gemini Pro：适用于各种通用任务的上佳模型。
Gemini Nano：适用于手机等设备的高效模型。

其中，视频演示是基于 Gemini Ultra 的，但目前 Google 还在测试阶段，未对公众开放。而集成到 Google Bard 上的将会是 Gemini Pro，能力大概是 ChatGPT 3.5 的水平。而 Gemini Nano 则更加有趣，它专为小型设备设计，是一款可运行在手机上的 AI 大模型！未来将会集成在 Google Pixel 手机系列里面。

基准测试结果：

根据谷歌公布的基准测试结果来看，Gemini 在与 OpenAI 的 ChatGPT 的 GPT-4 模型对比时展现出了非常强大的性能。除了 HellaSwag 数据集外，Gemini 在其他基准测试中都全面领先 GPT-4。

在 32 个广泛使用的学术基准测试中，Gemini Ultra 有30个超过了当前领先水平，更令人惊叹的是，在 MMLU（大规模多任务语言理解）测试中，Gemini Ultra 以 90.0% 的分数成为第一个超过人类专家的模型（这个测试结合了数学、物理、历史、法律、医学和伦理等 57 个科目）。

同时，在 MMMU 基准测试中，Gemini 也取得了 59.4% 的分数，这个测试涵盖了多领域的多模态任务，需要仔细推理。相比之前的 AI 只凭第一印象去回答问题，Gemini 会有明显的思考，得分表现也有了明显的提升。

总的来说，根据上面的视频测试看了，Gemini 确实非常强大！只希望这个能力不是播片效果，实装之后能给人工智能业界带来新的震撼吧。

/ 关注 “异次元软件世界” 微信公众号，获取最新软件推送 /

如本文“对您有用”，欢迎随意打赏异次元，让我们坚持创作！

赞赏一杯咖啡

X-Force
异次元软件世界、iPcFun.com 网站创始人。

本来名字很酷，但很无辜地被叫成小X，瞬间被萌化了。据说爱软件，爱网络，爱游戏，爱数码，爱科技，各种控，各种宅，不纠结会死星人，不折腾会死星人。此人属虚构，如有雷同，纯属被抄袭……

本文作者

异次元软件世界

全面碾压 GPT-4！谷歌 Gemini AI 上手测试视频：能力逆天

相当震撼！谷歌 Gemini 上手测试视频：

Gemini 模型根据不同的使用场景分为三个版本：

基准测试结果：

还有这些值得一看：