2023年12月7日,谷歌发布了新一代人工智能“Gemini”。
在发表的内容中,同时公布了与OpenAI的「ChatGPT-4」的比较结果。有人评价Gemini的演示视频有可能是捏造的,实际上Gemini不值得期待。
在这篇文章中,我特意将焦点放在了Gemini的消极部分上,对Gemini进行解说。
如果你同时了解了Gemini的消极和积极的一面,想要比任何人都活用Gemini,请务必看到最后。
谷歌生成人工智能Gemini的特征
谷歌公布了关于Gemini的内容,Gemini是谷歌针对Open AI的GPT-4的人工智能生成方案。
主要特征如下。
Gemini是谷歌开发的生成人工智能
略高于ChatGPT-4的性能
可以输入多个
Gemini有三种不同的模型
Gemini是谷歌开发的生成人工智能
Gemini是谷歌迄今为止最大的人工智能发布,其目的是在人工智能霸权争夺战中挑战竞争对手OpenAI和微软。
谷歌及其母公司Alphabet的首席执行官森达尔·皮采在接受《麻省理工科技评论》采访时表示。“那就是平台。人工智能是比网络和移动通信更大的平台转换。这对我们来说是一大步。”
虽然Gemini超过ChatGPT,但差距很小
谷歌的Deepmind声称,在32个标准性能测量中,Gemini在30个方面超过了GPT-4。但是,差距微乎其微。
从演示来看,很多事情都做得非常好,但似乎没有前所未见的新事物。
关于大规模生成人工智能的话题一直没有停止过,而关于Gemini的话题,现在很有可能达到顶峰。
华盛顿大学的奇拉格·沙教授专门研究在线搜索,他将谷歌此次的发布比作苹果公司每年都会发布新的iPhone。
Gemini可以输入多个
与GPT-4一样,Gemini是多式联运的。
主要的输入方法如下。
文本
图像
语音
而且,将这些不同的形式组合起来,可以回答从家务到大学数学、经济的所有问题。
谷歌展示了Gemini收集已有图表的截图,用新数据分析数百页调查结果,并利用新信息更新图表的能力。
在另一个例子中,Gemini给我看了一张煎蛋卷的照片,我用声音问他蛋卷是否还没有烤熟,他回答说:“鸡蛋还是水的,还没有。”
但是,据说Gemini的能力还不完善。
此次发布的版本是谷歌基于文本的搜索聊天机器人Bard的后端,据该公司称,该机器人能够赋予其更高级的推理、计划和理解能力。
强化了Gemini的新版本,预定在除欧盟和英国以外的170多个国家,可以依次使用英语。
Gemini有三种不同的模型
Gemini有“Ultra”、“Pro”、“Nano”三种尺寸可供选择。
“Ultra”:全功率版本
“Pro”:面向在有限计算资源下运行的应用
“Nano”:面向在谷歌新Pixel手机等设备上运行的应用
首先,开发者和企业将从12月13日开始使用Pro。
另外,谷歌高层在新闻发布会上对记者们说,最高型号的“Ultra”将在“2024年初”开始使用。
Gemini的演示视频可能是捏造的
2023年12月,谷歌开发的人工智能生成系统“Gemini”的演示视频发布。
“Gemini”的演示视频发布后,一天内就创下了100万次的点击量,但有人认为这是捏造的。
作为捏造的内容,由于视频被编辑过多,所以识别阅读度没有这么快。
其他的视频也很有可能因为判断太快而删除提示的部分。
因为剪辑的程度不明确,所以只要稍微给点提示,就有可能达到动画的效果,也有可能事与愿违。
也有人说Gemini没有那么厉害
被认为是业界标准的OpenAI公司的ChatGPT-4和Google公司的Gemini的比较结果被公布了。
不过,也有意见认为,结果并不值得那么惊讶。
比较结果如下。
Gemini获得了超过ChatGPT-4的结果
因为学习数据内容缺乏透明性,所以称不上优秀
普通用户感受不到的差别
Gemini获得了超过ChatGPT-4的结果
谷歌特别关注被称为MMLU(大规模多任务语言理解)的基准测试。
这是为了测试模型在包含文本和图像的任务中的表现而设计的一系列测试,例如阅读理解、大学数学、物理学、经济学和社会科学的多项选择题。
以下是在Gemini和ChatGPT-4上进行测试的结果。
课本问题的正确率如下所示。
GeminiChatGPT-4专家(人)
正答率90%86%89%
多式思维问题的正确率如下。
GeminiChatGPT-4
正答率59%57%
作为结论,谷歌的Gemini超过了ChatGPT-4的得分。
因为学习数据内容缺乏透明性,所以称不上优秀
谷歌曾公开宣称,Gemini的性能超过ChatGPT-4,但不能完全相信。
斯坦福大学foundation模型研究中心主任珀西·里安说。“虽然这个模型在基准测试得分上很优秀,但如果不了解学习数据的内容,就不知道该如何解释这个数字。”
米切尔也指出,与图像和视频相比,Gemini在语言和代码的基准测试方面的表现要出色得多。
据专家称,谷歌用于测量Gemini性能的基准测试范围可能较窄,难以评估。如果没有透明度,就很难确认谷歌的主张。
普通用户感受不到的差别
结论是,对于一般的生成人工智能用户来说,即使竞争模型有所改善,也很难感觉到差异。
这表明,便利性、品牌认知度、与现有产品的统一性等可能比生成人工智能的能力更重要。
Gemini的开发经过
最后,介绍一下Gemini开发至今的经过。
2月:发表“Bard”
3月:与Deepmind公司合并
5月:宣布导入统一的交流用人工智能
12月:发布Gemini
2月:发表“Bard”
2月发表了ChatGPT的竞争对手Bard,但是很快就发现了缺陷,结果给人留下了消极的印象。
3月:与Deepmind公司合并
2023年4月,谷歌宣布将人工智能研究部门谷歌大脑与位于伦敦的人工智能实验室DeepMind合并。
为此,谷歌花费了近一年的时间来对抗OpenAI的最先进大规模语言模型GPT-4, OpenAI于3月公布,并成为收费版ChatGPT的主干。
5月:宣布导入统一的交流用人工智能
5月,谷歌宣布将在从电子邮件到生产力软件的所有产品中导入通用人工智能。但是,结果并没有让评论家们钦佩,反而加深了他们的消极印象。
这是大规模的语言模型开发无法回避的问题。
虽然人工智能系统很擅长生成像人类写的文章,但它会定期地捏造文章。除此之外,因为容易被黑客攻击,充满偏见,所以必须慎重地进行开发。
谷歌还没有解决这些问题和幻觉问题。后一个问题的解决方法是让人们使用谷歌搜索来重复检查聊天机器人的答案,但这依赖于在线搜索结果本身的准确性。
12月:发布Gemini
2023年12月发布了Gemini。
但是,基于大规模语言模型构建的人工智能将如何进化尚未发表,因此有研究人员暗示,技术可能无法再进一步提高。
另一方面,皮采先生也说:“因为有很大的改善余地,所以会越来越好。”
总结
谷歌为了对抗OpenAI的“ChatGPT”,开发了“Gemini”,其内容已被公开。
Google公布的Gemini特征如下。
对抗OpenAI和微软的AI
略高于ChatGPT-4的性能
可以输入多个
另外,Gemini还提供以下3种型号。
“Ultra”:全功率版本
“Pro”:面向在有限计算资源下运行的应用
“Nano”:面向在谷歌新Pixel手机等设备上运行的应用
可以根据设备和用途进行选择。
在此次的发布会上,谷歌开发的Gemini虽然目前优于OpenAI公司的ChatGPT-4,但差距不大。
另外,演示视频也有可能是捏造的,所以Gemini的实际性能应该会在用户今后的使用过程中逐渐明确吧。