上周三,谷歌正式发布了被誉为地表最强大的AI模型——Gemini 1.0。这一创新突破标志着谷歌在人工智能领域的又一重大成就,标志着生成式人工智能进入了原生多模态时代。发布会上,一段六分钟的连续演示视频令所有观众震惊。谷歌CEO皮查伊吉利强调了这段视频的重要性,视频在一天内获得了720万播放量。网友们纷纷表示,Gemini看起来就像是一个无所不知的朋友,而不仅仅是一款AI产品。主要包括以下更新:
Gemini 1.0的核心特性
Gemini 1.0作为一个多感官模型的通用系统,能够无缝理解和推理包括文本、图像、音频、视频和代码在内的多种形式的信息。此外,Gemini的体积灵活性使其能够适应不同的设备需求,包括轻量级的Gemini nano和功能更强大的Gemini pro。
性能基准测试
在多个学术基准测试中,Gemini展现了其超越GPT-4的强大能力。在MLU测试中,它甚至超越了人类专家,这一成就标志着AI技术在理解和推理能力上的重大飞跃。
Gemini的先进技术
Gemini在编码能力上表现卓越,击败了85%的编程竞赛参赛者。它在理解和回答复杂主题问题上的能力尤其引人注目,特别是在数学和物理等复杂学科的推理方面表现出色。
Gemini pro和Gemini ultra的介绍
Gemini pro是一款专业版的安卓设备,配备了全面的Google搜索和办公产品。而Gemini ultra作为超大版本,预计明年初将在数据中心和企业中进行试用,这将进一步扩大Gemini的应用范围。
然而,随着网友们开始质疑这个演示视频的真实性,舆论风向发生了变化。彭博社记者帕米欧在推特上表示,这不是实时视频模型,而是根据静态图像和人类提示后制作的。同时,机器学习讲师特拉购指出,视频开头的免责声明或许暗示了展示的是精选结果,且经过剪辑。
在这些争议中,谷歌官方博客发表声明,承认演示视频中的炫目操作并非实时生成,而是经过了后期制作和剪辑。深化理解,谷歌deep mind的研究副总裁波热维尼在推特上也确认,虽然视频中的人类提示和AI输出都是真实的,但为了简洁起见,视频内容进行了缩短。
谷歌对Gemini的未来规划富有雄心,计划增强其感官能力,以更好地理解人类世界,并逐步靠近人工通用智能(AGI)。然而,围绕Gemini发布会的虚假宣传争议亦不容忽视。发布会上展示的视频并非实时生成,而是经过后期制作和剪辑,这引发了对Gemini真实能力的质疑。尽管如此,谷歌的股价因此次发布而大幅上涨。
谷歌的Gemini 1.0无疑是AI领域的一次重大突破,其超越GPT-4的性能展现了人工智能的巨大潜力。同时,发布会造假争议也提醒了我们,对于新技术的宣传和展示需要保持一定的谨慎和透明度。总体而言,Gemini的出现不仅提升了谷歌在AI领域的地位,也为整个科技界带来了新的启示和挑战。