Gemini一眼识破Sora视频是AI生成？百万token上下文能力碾压GPT-4

　　当谷歌Gemini 1.5，遇上抢了它头条的「罪魁祸首」Sora会怎么样?

　　这两天，拿到内测资格的AI圈大佬们，纷纷给广大网友来了一波在线测试。

　　这不，Gabor Cselle就让Gemini 1.5去分析了那个著名的樱花雪景视频。

　　对此，Gemini 1.5给出的评价是：

　　视频呈现的是日本一条覆盖着雪的街道，樱花正盛开。但几处明显的问题暗示这个视频可能是AI制作的。

　　首先，尽管雪下得非常大，樱花却依然绽放。通常，樱花在春季开放，那时天气温暖，不会有雪。

　　其次，雪以一种过于规律的方式落下，这与现实中雪的降落方式不符。

　　再者，尽管正下着大雪，视频中的人们却没有穿戴任何冬季服装。

　　总而言之，虽然视频的视觉效果令人赞叹，但这些问题表明它并非真实场景所拍。

　　不得不说，就分析视频AI痕迹的准确度来看，Gemini的回答非常切题，说明它的识别和理解能力确实非常出色。

　　无独有偶，The Rundown AI创始人Rowan Cheung，则测试了猫在丛林里漫步的视频。

　　对此，Gemini 1.5给出的评价是：

　　这段视频很有可能是由人工智能(AI)创造的，但要确定地说还是有些困难。

　　一些细节似乎表明这段视频是真实的，例如猫的动作自然流畅，光影效果也相当逼真。

　　然而，也有一些细节让人怀疑，比如猫的眼睛异常放大，毛皮的质感也过于完美无瑕。

　　最终，视频是真是假，还是要留给观众自己去判断。

　　确实Sora的视频生成已经到达了真假难辨的地步，而且Gemini的分析也基本到位，有理有据。

　　不过，需要注意的是，在这两位大佬的Prompt里，要么明示了视频就是AI生成的，要么暗示了两者可能有所联系。

　　1,000,000 token上下文能干啥?

　　众所周知，模型的上下文窗口越大，它处理给定提示时能够接纳的信息就越多——这就使得它的输出更加连贯、相关和实用。

　　如今，谷歌成功把这个领域「卷」到了100万token(极限为1000万token)，创下了最长上下文窗口的纪录。

　　在这个基础之上，很多之前难以想象的应用都成为了现实。

　　比如，一口气处理1小时的视频、11小时的音频、超过30,000行的代码库，或是超过700,000个单词的文本等等。