0°

Google发布大模型Gemini,超越现有的所有的人工智能大模型

  1、Google Gemini发布概要

  北京时间12月7日凌晨,谷歌CEO桑达尔·皮查伊和DeepMind CEO戴密斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0版本正式上线。

  官网有详细介绍:

  https://deepmind.google/technologies/gemini/#capabilities

  2、全面超越Open AI Chatgpt4

  文本处理:

  据说AlphaCode的代码能力媲美在Codeforces上参加过测试的几乎一半程序员(2300名)。按照一个初级程序员月薪2万的算法,AlphaCode有望每年替全球人类资本家省下5.52亿的人力成本,使一半程序员失业…… 不过,DeepMind团队当时也明确指出了:AlphaCode目前只适用于竞争类编程比赛。

  与以前的 AI 程序员不同,AlphaCode 相对幼稚,没有关于计算机代码语法或结构的内置知识。它通过观察现有代码来学习,并能够解构和组合“单词”和“短语”。AlphaCode 采用依赖“数据”的方法,通过为单个问题生成超过一百万个潜在解决方案来解决逐段编写代码时容易出现的无效或不正确代码的问题。AlphaCode 的优势在于其完全的独创性,它能够想出聪明的片段,而无需在其“阅读材料”中复制大块代码或逻辑。这种创造力可能是由于其数据驱动的学习方式。

  Gemini 在所有多模态任务上都超越了 SOTA(State-Of-The-Art)的性能。

  在权威MMMU基准测试中,Gemini Ultra获得了59.4%的SOTA分数。这项基准测试是经典的多模态测试,由跨不同领域的多模式任务组成,能够体现大模型的深度推理能力。

  超越GPT-4(五星评分)的SOTA评分

  备注:SOTA评分:在计算机视觉领域,SOTA(State-Of-The-Art)评分通常是指在某个数据集上取得的最佳性能得分。这个评分是通过与其他已发表的方法进行比较得出的,通常是通过准确率、召回率、F1 值等指标来衡量的。

  3、版本:

  Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞品,包括三种不同套件,分别是Gemini Ultra、Gemini Pro和Gemini Nano。其中Ultra的能力最强,能够处理最为困难的多模态任务;Pro能力稍弱,是一个可扩展至多任务的模型;Nano则是一款可以在手机端侧运行的模型。这说明,Gemini的触达范围很广,可以下探至数据中心,也可以上行至移动设备端侧。

  4、效果

  在一段公布的演示视频中,Gemini展示了对视频、图像的非同凡响的识别能力。在视频中,Gemini极为自如地在图像、音频、视频各模态之间的转换,展现了惊人的解锁应用场景与产品形态的潜力。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论