当谷歌Gemini 1.5,遇上抢了它头条的「罪魁祸首」Sora会怎么样?
这两天,拿到内测资格的AI圈大佬们,纷纷给广大网友来了一波在线测试。
这不,Gabor Cselle就让Gemini 1.5去分析了那个著名的樱花雪景视频。
对此,Gemini 1.5给出的评价是:
视频呈现的是日本一条覆盖着雪的街道,樱花正盛开。但几处明显的问题暗示这个视频可能是AI制作的。
首先,尽管雪下得非常大,樱花却依然绽放。通常,樱花在春季开放,那时天气温暖,不会有雪。
其次,雪以一种过于规律的方式落下,这与现实中雪的降落方式不符。
再者,尽管正下着大雪,视频中的人们却没有穿戴任何冬季服装。
总而言之,虽然视频的视觉效果令人赞叹,但这些问题表明它并非真实场景所拍。
不得不说,就分析视频AI痕迹的准确度来看,Gemini的回答非常切题,说明它的识别和理解能力确实非常出色。
无独有偶,The Rundown AI创始人Rowan Cheung,则测试了猫在丛林里漫步的视频。
对此,Gemini 1.5给出的评价是:
这段视频很有可能是由人工智能(AI)创造的,但要确定地说还是有些困难。
一些细节似乎表明这段视频是真实的,例如猫的动作自然流畅,光影效果也相当逼真。
然而,也有一些细节让人怀疑,比如猫的眼睛异常放大,毛皮的质感也过于完美无瑕。
最终,视频是真是假,还是要留给观众自己去判断。
确实Sora的视频生成已经到达了真假难辨的地步,而且Gemini的分析也基本到位,有理有据。
不过,需要注意的是,在这两位大佬的Prompt里,要么明示了视频就是AI生成的,要么暗示了两者可能有所联系。
1,000,000 token上下文能干啥?
众所周知,模型的上下文窗口越大,它处理给定提示时能够接纳的信息就越多——这就使得它的输出更加连贯、相关和实用。
如今,谷歌成功把这个领域「卷」到了100万token(极限为1000万token),创下了最长上下文窗口的纪录。
在这个基础之上,很多之前难以想象的应用都成为了现实。
比如,一口气处理1小时的视频、11小时的音频、超过30,000行的代码库,或是超过700,000个单词的文本等等。