(华盛顿8日讯)谷歌(Google)6日推出自家的生成式AI模型“Gemini”,迎战问世一年多的ChatGPT,然而发布才过一天,外界已经开始质疑谷歌展示的性能有“粉饰造假”之嫌。
Gemini分为Ultra、Pro、Nano三种版本,Ultra功能最完整,Pro与Nano则是为运算资源较有限的应用程式量身打造。Nano是专为谷歌新款Pixel手机等设备打造;开发人员与企业则可在12月13日起开始使用Pro。功能最强的Ultra得等到明年初正式上线。
彭博资讯专栏作家奥森(Parmy Olson)8日撰文指出,谷歌公布的性能表显示Ultra(蓝色)在多数标准基准测试中都击败了GPT-4,包括高中物理、专业法律问题和道德情境等项目,“但只赢几个百分点”。换句话说,谷歌的顶级AI模型只是在OpenAI至少一年前的成果上取得些微进展,而Ultra仍尚未对外公开。
奥森说,Gemini的展示影片确实令人印象深刻,仅凭一些毫无规则的点就能推断出展示人员在画一隻螃蟹,显示谷歌DeepMind实验室多年来训练的推理能力。但影片展示的其他一些功能就并不独特,ChatGPT Plus也具有类似推理能力。
此外,谷歌也承认这段6分钟影片经过剪辑,描述栏中写道:“为了展示用途,本影片有减少延迟,缩短Gimini的输出,以求精简。”这代表它实际给出回应的时间比影片更长。奥森还透露,就连影片中展示人员与Gimini一搭一唱都是预先设好的。
谷歌发言人回应彭博指出,那是透过“使用影片中的静止图帧,并给予文字提示”制作。也就是说,性能展示不是即时进行,是先让Gimini看过静态影像,透过人为编写文本指令,要求Gemini预测来做出回应。这跟影片想呈现出的流畅人机互动有很大落差。
奥森认为,一年前谷歌这个“笨拙的搜索引擎巨擘”被OpenAI的ChatGPT打个措手不及,此后便一直希望赶上生成式AI浪潮。如今抓准OpenAI宫斗刚落幕的机会,谷歌透过强力行销想让人们记住,他们拥有世上最强大的人工智慧研究团队之一,借此吸引OpenAI的企业客户转投阵营。
奥森表示,外界应对此保持谨慎,因为“谷歌仍在从后赶上”。麻省理工科技评论(Mit Technology Review)指出,发表Gemini对谷歌而言是跨出一大步,但对整体业界不算是。华盛顿大学转攻线上搜寻的教授沙赫(Chirag Shah)将此比喻为每年苹果iPhone发表会,“不太令人印象深刻,毕竟我们已看得太多”。