这些天的硅谷,乱成了一锅粥。
OpenAI CEO 山姆-奥特曼直接在社交平台公开嘲讽谷歌的审美过于差劲,他表示:我努力不去过多思考我们的竞争对手,但我无法不去思考 OpenAI 和谷歌之间的美学差异。
下面附着的两张发布会现场图,左边是 OpenAI,右边是谷歌。言下之意,就是 OpenAI 干净明了,极具科技感;而谷歌则离人群非常远,十分过时。
OpenAI CEO 山姆-奥特曼
山姆-奥特曼如此气急败坏,还是因为在上周,OpenAI 和谷歌同时发布 AI 新品,双方打的你来我往:你说 GPT-4o 全球最先进,我说 Gemini 家族能覆盖全生态全路径。
两家硅谷巨头的直接对抗,把科技竞赛的强度拉满,就连 CEO 本人都坐不住了。
1、谷歌 AI 全家桶上线
山姆-奥特曼嘲讽谷歌并不是无的放矢,这场谷歌 I / O 大会在观看性上,确实差强人意。
首先是时间太长,谷歌 I / O 大会足足有接近两个小时,主持人连续提起了 121 次 AI 字眼,甚至有观众在社交平台抱怨自己都快睡着了。
然后就是产品太多,比起 OpenAI 仅有 GPT-4o 一款新品,谷歌这次则推出了十余种 Gemini 大模型的升级及新品,可以说是“AI 全家桶”。
发布 AI 搜索:Google Search;
升级了 Gemini 大模型:Gemini 1.5 Flash(100 万上下文)、Gemini Pro(200 万上下文);
新发布了手机版 Gemini App:以手机应用程序形式,支持和 AI 视频对话;
发布视觉语言模型 Project Astra:拥有 Imagen3(图像)、Music AI Sandbox(音乐)、Veo(视频生成)三种能力。
虽然谷歌 AI 全家桶看上去格外炫酷,但实际上对比 OpenAI 的 GPT-4o 依然差上很多,更多是硬件性升级,单纯给大模型升级一下参数。
最令人印象深刻的两项功能,是 AI 搜索 Google Search 和 AI 助理 Project Astra。
首先是 Google Search,搜索作为谷歌起家的根本,这些年遭受到了微软的重创。微软的 Bing 已经借助 ChatGPT,给传统搜索引擎带来了“亿点点”AI 降维打击。
甚至就连 OpenAI 也在盛传将推出 AI 搜索类产品,来抢占 Google 搜索市场。
压力之下,谷歌推出 Google Search 来稳定自家护城河,下定决心重塑搜索体验。
据演示视频来看,Google Search 最核心的功能,就是搜索摘要功能 AI Overview。
所谓的“搜索摘要功能”,就是谷歌之前提出来的“搜索生成式体验(SGE)”。
用户在搜索框内键入文本,直接在最上方跳出 AI 帮忙整理的信息摘要。其中包含用自然语言对搜索结果的总结和概括,以及推荐的链接。
AI Overview 还内置了“多步推理功能 Multi-Step Reasoning”、“计划功能 Planning in Search”、“视频提问 Ask With Video”。
另外一个发布会亮点,就是谷歌推出的 AI 助理 Project Astra。
Project Astra 就是一个完全对标 GPT-4o 的产品,产品形态和使用逻辑基本和 ChatGPT 无二。用户可以和它实时对话、视频聊天。
并且,和 GPT-4o 一样,Project Astra 也提供文生图、文生视频两项功能。只不过不叫 DALL・E 和 Sora,而是叫做 Imagen 3 和 Veo。
唯一有点不一样的,就是 Project Astra 提供了音乐生成模型 Music AI Sandbox。
用户可以上传一小段音乐 demo,Music AI Sandbox 能在此基础上拓展延长。用户还可以输入提示词,进一步调整音乐风格,进行乐曲的二度创作。
总之,用一句话来概括谷歌 AI 全家桶,就是:东西很多,精品很少。
我们能在一系列 AI 新产品里,不断看到 ChatGPT 的影子,但单纯是在 GPT-4o 做好的框架里缝缝补补,升级一下算力,换个新框架。
能给用户带来震撼感的产品呢?
依然没有看到。
2、越来越像人类的 GPT-4o
比起谷歌的多到凌乱,OpenAI 则是简洁明了。
仅仅只有半个多小时,全程由公司 CTO 和两位工程师 face to face,以对话形式展示产品,非常具有电影感。
甚至 CEO 山姆-奥特曼都没有现身发布会,完全用产品力来震撼用户。
现场的演示嘉宾拿着手机摄像头,让 GPT-4o 识别自己的表情,来判断自己的情绪。
GPT-4o 很快识别完成,说:你看起来很开心,带着灿烂的笑容,甚至有一丝兴奋,你能分享你快乐的来源吗?
演示嘉宾在纸上写了“i love you”给 GPT-4o,GPT-4o 用带有一丝丝娇羞、热情四溢的语气快速回应着人类的“爱意”。
GPT-4o 能感受到你的呼吸节奏、能“看出”你文字当中包含的情绪、甚至可以打断它的话,重新为话题增加新的语境,它也能作出完美回应……
这样的人工智能,让你想到了什么?
是的,一个完美恋人。
就像是 2013 年上映的好莱坞电影《Her》,斯嘉丽配音的人工智能和人类谈起了恋爱。
这一幕,逐渐成为现实。谁会不喜欢一个热情洋溢、事事有回应、提供丰富情绪价值的伴侣呢?
哪怕它是 AI。
GPT-4o 给后来者谷歌一个下马威,也给出未来 AI 大模型的一个满分答案:不管是生成式 AI 大模型也好,聊天机器人也好,不用再去关心什么硬件什么参数,AI 的最终方向就是越来越像人类。
OpenAI 并没有过多描述自己的算力、自己的硬件升级,只是由首席技术官穆里・穆拉蒂 (Muri Murati) 表示,GPT-4o 将提供与 GPT-4 同等水平的智能,但在文本、图像以及语音处理方面均取得了进一步提升,“GPT-4o 可以综合利用语音、文本和视觉信息进行推理。”
现阶段的 GPT-4o 已经摆脱了对文本、图片或语音的束缚,它的识别能力进化到了“听觉”和“视觉”。
用“听”来捕捉情绪变化,比如能判断对方急促的呼吸方式不对;用“看”来识别你写在纸上的方程式数学问题,一步步教你解题步骤。
甚至它还可以通过手机摄像头,回答你“这个人穿什么牌子的衬衫?”
比起谷歌眼花缭乱、不知从哪下手的 AI 全家桶,GPT-4o 已经领先到大气层了。
3、免费,但又不完全免费
GPT-4o 除了在能力上,给了谷歌一个下马威外,OpenAI 还放了大招:
穆里-穆拉蒂表示,GPT-4o 将免费提供给所有用户使用,不但当下免费,甚至以后 OpenAI 做产品就是要免费优先,为的就是让更多的人能使用。
就连 OpenAI CEO 山姆奥特曼表示,新的 GPT-4o 是 OpenAI 有史以来最好的模型,它可供所有 ChatGPT 用户使用,无论是免费版本还是付费 GPT-4 版。
不得不说,当服务免费时,用户就是产品。
如果 GPT-4o 真的能彻底取消付费制度,那么 OpenAI 获得的数据量会超出想象。
可惜的是,OpenAI 还是缺少“用免费改变世界”的魄力,背后还是有不少的猫腻。
首先,OpenA 在官网公告上明确说明,免费用户在使用 GPT-4o 时,OpenAI 做出了权限上的分级。
免费用户可以使用 GPT-4o 的分析数据、创建报表、处理照片、上传文件、使用记忆功能等,基本上 GPT-4o 涵盖了 GPT4 所有的付费功能。
但是免费用户会有消息数量的限制,PIUS 用户的消息将是免费用户的 5 倍,Team 和 Enterprise 用户限制将会更高。
每天能用多久?每天能发几条?GPT-4o 并没有详细说明。
或许,我们可以参考 OpenAI 上一代 GPT-4,限制每个用户每天的使用时间在 3 小时以内,并限制每天生成的信息数量不超过 25 条。
虽然说这一限制在一定程度上,提高了信息的质量和用户的注意力。但还是要感叹一句,互联网的免费,永远不是真免费。
哪怕到了 AI 时代,这个法则也同样适用。