0°

Gemini一眼识破Sora视频是AI生成?百万token上下文能力碾压GPT-4

  当谷歌Gemini 1.5,遇上抢了它头条的「罪魁祸首」Sora会怎么样?

  这两天,拿到内测资格的AI圈大佬们,纷纷给广大网友来了一波在线测试。

  这不,Gabor Cselle就让Gemini 1.5去分析了那个著名的樱花雪景视频。

  对此,Gemini 1.5给出的评价是:

  视频呈现的是日本一条覆盖着雪的街道,樱花正盛开。但几处明显的问题暗示这个视频可能是AI制作的。

  首先,尽管雪下得非常大,樱花却依然绽放。通常,樱花在春季开放,那时天气温暖,不会有雪。

  其次,雪以一种过于规律的方式落下,这与现实中雪的降落方式不符。

  再者,尽管正下着大雪,视频中的人们却没有穿戴任何冬季服装。

  总而言之,虽然视频的视觉效果令人赞叹,但这些问题表明它并非真实场景所拍。

  不得不说,就分析视频AI痕迹的准确度来看,Gemini的回答非常切题,说明它的识别和理解能力确实非常出色。

  无独有偶,The Rundown AI创始人Rowan Cheung,则测试了猫在丛林里漫步的视频。

  对此,Gemini 1.5给出的评价是:

  这段视频很有可能是由人工智能(AI)创造的,但要确定地说还是有些困难。

  一些细节似乎表明这段视频是真实的,例如猫的动作自然流畅,光影效果也相当逼真。

  然而,也有一些细节让人怀疑,比如猫的眼睛异常放大,毛皮的质感也过于完美无瑕。

  最终,视频是真是假,还是要留给观众自己去判断。

  确实Sora的视频生成已经到达了真假难辨的地步,而且Gemini的分析也基本到位,有理有据。

  不过,需要注意的是,在这两位大佬的Prompt里,要么明示了视频就是AI生成的,要么暗示了两者可能有所联系。

  1,000,000 token上下文能干啥?

  众所周知,模型的上下文窗口越大,它处理给定提示时能够接纳的信息就越多——这就使得它的输出更加连贯、相关和实用。

  如今,谷歌成功把这个领域「卷」到了100万token(极限为1000万token),创下了最长上下文窗口的纪录。

  在这个基础之上,很多之前难以想象的应用都成为了现实。

  比如,一口气处理1小时的视频、11小时的音频、超过30,000行的代码库,或是超过700,000个单词的文本等等。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论