昨天,谷歌的人工智能研究实验室 Google DeepMind 推出了备受期待的模型Gemini,据报道,该模型在主要基准测试中超过了 OpenAI 的 GPT-4。
自从 OpenAI 一年前推出 ChatGPT 以来,领先的科技公司一直陷入了 AI 进步的竞争中。到目前为止,Microsoft作为人工智能公司的主要投资者,由于它获得了OpenAI的模型,因此略有上升。谷歌的Bard(ChatGPT 的竞争对手)的最初版本是的平淡无奇的。谷歌普遍落后于OpenAI和Microsoft。然而,Google Gemini 可能是一个非常大的进步,可以超越 OpenAI。
什么是Gemini?
根据谷歌的说法,Gemini之所以如此出色,是因为它的多模态能力、复杂的推理和先进的编码能力。与其他首先基于文本构建,然后添加图像数据的多模态 AI 模型不同,Gemini 原生是多模态的。这意味着除了文本之外,它从一开始就对音频和图像模态进行了预训练。“这有助于Gemini从头开始无缝地理解和推理各种输入,远远优于现有的多模式模型,”
Gemini 在 MMLU(大规模多任务语言理解)上的得分为 90%,而 GPT-4 的得分为 86.4%,MMLU 测试了多学科知识和解决问题的能力。
谷歌已经针对三种不同的尺寸优化了 Gemini:Gemini Ultra,用于高度复杂任务的最大型号,Gemini Pro,能够完成大多数其他任务的中量级型号,以及 Gemini Nano,一种足够小的高效型号,可以放在你的手机上。
Gemini Nano 将在 Google Pixel 8 Pro 手机上运行。明年,谷歌计划发布由Gemini Ultra提供支持的Bard高级版本。