谷歌在当地时间周三宣布推出其认为是迄今为止规模最大、能力最强的人工智能模型 Gemini,以回应公司如何盈利化 AI 的迫切问题。
这个大型语言模型 Gemini 包括三种不同规模的套件:最大、最强大的 Gemini Ultra;适用于广泛任务的 Gemini Pro;以及专用于特定任务和移动设备的 Gemini Nano。
目前,该公司计划通过谷歌云将 Gemini 授权给客户,供他们在自己的应用程序中使用。从 12 月 13 日起,开发者和企业客户可以通过 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 访问 Gemini Pro。安卓开发者也将能够使用 Gemini Nano 进行构建。Gemini 还将用于驱动谷歌产品,如其 Bard 聊天机器人和尝试以对话式文本回答搜索查询的搜索生成体验(SGE),后者尚未广泛推出。
公司和企业可以使用 Gemini 进行更先进的客户服务互动,如聊天机器人和产品推荐,以及识别公司想要宣传产品的趋势。Gemini 还可以用于内容创作,如果公司想要创建营销活动或博客内容,以及希望总结会议或为开发者生成代码的生产力应用程序。
该公司给出的例子包括让 Gemini 获取图表的截图,并分析数百页研究,然后更新该图表。另一个例子是分析一个人的数学家庭作业照片,并识别正确答案和指出错误答案。
Gemini Ultra 是首个在 MMLU(大规模多任务语言理解)上胜过人类专家的模型,MMLU 使用 57 个科目的组合,如数学、物理、历史、法律、医学和伦理,测试世界知识和解决问题的能力。据该公司在周三的博客文章中表示,它能够理解复杂主题中的细微差别和推理。
「Gemini 是谷歌团队间大规模合作努力的结果,包括我们在谷歌研究的同事,」皮查伊在周三的博客文章中写道。「它从头开始构建,是多模态的,这意味着它可以泛化,并无缝理解、操作和结合不同类型的信息,包括文本、代码、音频、图像和视频。」
从今天开始,谷歌的聊天机器人 Bard 将使用 Gemini Pro 来帮助进行高级推理、计划、理解和其他能力。明年初,它将推出使用 Gemini Ultra 的「Bard Advanced」,这将是 Bard 更新的最大一次,它类似于 OpenAI 的 ChatGPT 聊天机器人。
这次更新是在谷歌首次推出 Bard 和 OpenAI 在 GPT-3.5 上推出 ChatGPT 一年后进行的。今年 3 月,由 Sam Altman 领导的初创公司推出了 GPT-4。高管们周二表示,Gemini Pro 在性能上超过了 GPT-3.5,但对于与 GPT-4 的比较避而不谈。
然而,据谷歌周三发布的一份白皮书显示,Gemini 的 Ultra 模型在一些基准测试中超过了 GPT-4。
当被问及谷歌是否计划对「Bard Advanced」的访问收费时,谷歌 Bard 的总经理 Sissie Hsiao 表示,公司专注于创造良好的体验,目前还没有任何盈利细节。
在新闻发布会上,当被问及 Gemini 与当前一代 LLM 相比是否有任何新颖功能时,谷歌 DeepMind 的产品副总裁 Eli Collins 回答说:「我怀疑它确实有」,但他们仍在努力了解 Gemini Ultra 的新颖功能。
据报道,谷歌推迟了 Gemini 的发布,因为它还没准备好,这让人回想起该公司年初推出其 AI 工具时的混乱局面。
多名记者询问了关于延迟的问题,对此 Collins 回答说,测试更先进的模型需要更长的时间。Collins 表示,Gemini 是该公司构建的经过最严格测试的 AI 模型,并且是谷歌任何模型中「最全面的安全评估」。
Collins 说,尽管 Gemini Ultra 是其最大的模型,但提供服务的成本显著降低。他说:「它不仅能力更强,而且更高效。我们仍然需要大量计算来训练 Gemini,但我们在训练这些模型方面变得更加高效。」
Collins 表示,该公司将在周三发布一份关于该模型的技术白皮书,但他表示不会公布参数数量。今年早些时候,CNBC 发现谷歌的 PaLM 2 大型语言模型,当时的最新 AI 模型,其训练用的文本数据量是前一代 LLM 的近五倍。
同样在周三,谷歌还推出了其下一代用于训练 AI 模型的张量处理单元。Salesforce 和初创公司 Lightricks 已开始使用的 TPU v5p 芯片,其性能价格比优于 2021 年宣布的 TPU v4,但谷歌没有提供与市场领导者 Nvidia 相比的性能信息。
这一芯片发布是在云计算竞争对手亚马逊和微软展示针对 AI 的定制芯片几周后进行的。
在 10 月的谷歌第三季度财报电话会议上,投资者向高管们提出了更多关于谷歌如何将 AI 转化为实际利润的问题。
今年 8 月,谷歌推出了一个名为「搜索生成体验」(SGE)的「早期实验」,该实验让用户看到在使用搜索引擎时生成式 AI 体验是什么样的——搜索仍然是该公司的主要盈利中心。其结果更具对话性,反映了聊天机器人时代的特点。然而,它仍被视为实验,并尚未向公众推出。
自从 5 月公司在其年度开发者大会 Google I/O 上首次宣布该实验以来,投资者一直在询问 SGE 的时间表。Gemini 周三的公告几乎没有提及 SGE,高管们对其向公众推出的计划含糊其辞,称 Gemini 将「在明年」并入其中。
皮查伊在周三的博客文章中表示:「这个模型驱动的新时代代表了我们作为一家公司所做出的最大的科学和工程努力之一。」「我对未来以及 Gemini 将为世界各地的人们带来的机会感到由衷的兴奋。」