周三,谷歌宣布了 Gemini,这是一个多模态 AI 模型系列,它希望能够与 OpenAI 的 GPT-4 相媲美,后者为 ChatGPT 的付费版本提供动力。谷歌声称,Gemini 的最大版本超过了“大型语言模型 (LLM) 研究和开发中使用的 30 个广泛使用的学术基准中的 32 个的最新结果”。这是 PaLM 2 的后续产品,PaLM 4 是谷歌希望在功能上与 GPT-<> 相匹配的早期 AI 模型。
作为Google Bard聊天机器人的一部分,其中级Gemini模型的特别调整的英文版本。现已在170多个国家/地区推出,但由于潜在的监管问题,该模型尚未在欧盟或英国推出。
与 GPT-4 一样,Gemini 可以处理多种类型(或“模式”)的输入,使其成为多模态的。这意味着它可以处理文本、代码、图像甚至音频。目标是制造一种人工智能,能够准确解决问题、提供建议和回答各个领域的问题——从一般到科学。谷歌表示,这将推动计算的新时代,并希望将该技术紧密集成到其产品中。
谷歌声称,“Gemini 1.0 复杂的多模态推理功能可以帮助理解复杂的书面和视觉信息,“它通过阅读、过滤和理解信息从数十万份文件中提取见解的卓越能力将有助于在从科学到金融的许多领域以数字速度实现新的突破。”
谷歌表示,Gemini 将提供三种版本:Gemini Ultra(“用于高度复杂的任务”)、Gemini Pro(“用于扩展各种任务”)和 Gemini Nano(用于“设备任务”,如谷歌的 Pixel 8 Pro 智能手机)。每个参数的复杂性可能按参数计数分开。更多的参数意味着更大的神经网络,通常更有能力执行更复杂的任务,但需要更多的计算能