谷歌(Google)周三将推出其认为规模最大、功能最强大的人工智能模型,该公司面临的压力越来越大,需要回答如何将人工智能货币化的问题。
大型语言模型Gemini将包括三种不同尺寸的套件:最大、功能最强的Gemini Ultra;Gemini Pro,它可以扩展各种任务;以及将用于特定任务和移动设备的Gemini Nano。
目前,该公司正计划通过谷歌云将Gemini授权给客户,让他们在自己的应用程序中使用。从12月13日开始,开发者和企业客户可以通过Google AI Studio或Google Cloud Vertex AI中的Gemini API访问Gemini Pro。安卓(Android)开发者也可以使用Gemini Nano进行开发。Gemini还将用于支持谷歌的产品,如Bard聊天机器人和搜索生成体验(Search Generative Experience,SGE),后者试图用对话式文本回答搜索查询(SGE尚未广泛使用)。
公司和企业可以通过聊天机器人和产品推荐,将其用于更高级的客户服务,以及为希望宣传产品的公司识别趋势。如果公司想要创建营销活动或博客内容,Gemini也可以用于内容创建,以及可能想要总结会议或为开发人员生成代码的生产力应用程序。
该公司给出了一些例子,包括展示Gemini能够截取图表的截图,分析数百页的研究结果,然后更新图表。另一个例子是分析一个人的数学作业的照片,找出正确的答案并指出错误的答案。
该公司周三在一篇博客文章中表示,Gemini Ultra是第一个在MMLU(大规模多任务语言理解)上超越人类专家的模型,该模型结合了数学、物理、历史、法律、医学和伦理学等57个学科来测试世界知识和解决问题的能力。据说它可以理解复杂主题的细微差别和推理。
谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)周三在一篇博客文章中写道:“Gemini是谷歌各团队大规模合作的结果,包括谷歌研究部门的同事。它从头开始构建为多模式,这意味着它可以概括和无缝理解,跨操作和组合不同类型的信息,包括文本,代码,音频,图像和视频。”
从今天开始,谷歌的聊天机器人Bard将使用Gemini Pro来帮助实现高级推理、规划、理解和其他功能。该公司高管周二在与记者的电话会议上表示,明年初,该公司将推出采用Gemini Ultra技术的Bard Advanced产品。这是对Bard的最大更新,它的聊天机器人类似于ChatGPT。
这次更新是在搜索巨头谷歌首次推出Bard八个月之后,也是OpenAI在GPT-3.5上推出ChatGPT一年之后。今年3月,这家由萨姆·奥特曼(Sam altman)领导的初创公司推出了GPT-4。高管们周二表示,Gemini Pro的表现优于GPT-3.5,但回避了与GPT-4相比如何的问题。
然而,根据谷歌周三发布的白皮书,Gemini Ultra在一些基准测试中表现优于GPT-4。
当被问及谷歌是否计划对“Bard Advanced”的访问收费时,谷歌的Bard总经理西西·萧(Sissie Hsiao)表示,谷歌将专注于创造良好的体验,目前还没有任何盈利细节。
在新闻发布会上,当被问及与当前一代LLM相比,Gemini是否有什么新颖的功能时,谷歌DeepMind产品副总裁伊莱·柯林斯(Eli Collins)回答说:“我怀疑有”,但它仍在努力了解Gemini Ultra的新颖功能。
据报道,谷歌推迟了Gemini的发布,因为它还没有准备好,这让人想起了该公司今年年初推出人工智能工具时遇到的困难。
多名记者询问延迟的原因,柯林斯回答说,测试更先进的型号需要更长的时间。柯林斯表示,Gemini是该公司打造的经过最严格测试的人工智能模型,它拥有谷歌所有模型中“最全面的安全评估”。
柯林斯说,尽管是其最大的型号,但Gemini Ultra的服务成本要低得多。“它不仅功能更强,效率也更高。”他说,“我们仍然需要大量的计算来训练Gemini,但就训练这些模型的能力而言,我们的效率要高得多。”
柯林斯说,该公司将于周三发布一份技术白皮书,详细介绍该机型。今年早些时候,CNBC发现谷歌的PaLM 2大型语言模型(当时最新的人工智能模型)使用的文本数据量是其前身LLM的近五倍。
同样在周三,谷歌推出了用于训练人工智能模型的下一代张量处理单元。谷歌表示,Salesforce和初创公司Lightricks已经开始使用的TPU v5p芯片,比2021年发布的TPU v4提供了更好的性能和价格。但该公司没有提供与市场领导者英伟达(Nvidia)进行比较的性能信息。
几周前,云计算竞争对手亚马逊(Amazon)和微软(Microsoft)展示了针对人工智能的定制硅芯片。
在谷歌去年10月举行的第三季度财报电话会议上,投资者向高管们提出了更多有关谷歌将如何将人工智能转化为实际利润的问题。
今年8月,谷歌推出了一项名为“搜索生成体验”(Search Generative Experience,简称SGE)的“早期实验”,让用户看到使用搜索引擎时生成的人工智能体验是什么样子的——搜索仍然是谷歌的主要利润中心。结果是更具对话性,反映了聊天机器人的时代。然而,它仍然被认为是一个实验,尚未向公众推出。
自5月份以来,投资者一直在询问SGE的时间表,当时该公司首次在其年度开发者大会Google I/O上宣布了这项试验。Gemini周三发布的公告几乎没有提及搜索生成体验,高管们对其向公众推出的计划也含糊其辞,只是说Gemini将在“明年”并入搜索生成体验。
“这个新时代的模型代表了我们作为一家公司所做的最大的科学和工程努力之一。”皮查伊在周三的博客文章中说,“我真的为未来感到兴奋,也为Gemini为世界各地的人们带来的机会感到兴奋。”