0°

Gemini模型问世,多模态处理能力攀新峰

  在2023年12月6日晚上,谷歌发布一款新型模型——Gemini,涵盖了Ultra、Pro和Nano三个不同大小的优化版本。

  此款模型的优势在于它能够出色地处理多项任务。

  其表现优于GPT4和mmlu能力。

  据称,Gemini成为首个在MMLU(大范围多任务语言理解)领域胜过人类专家模型的平台。并在30/32项学术基准中保持领先地位,涉及数学、物理和历史在内57个科目。

  Gemini采用了全面的多元模式设计,支持预训练及额外多模态数据微调,进一步提升了对各类输入的理解与推论能力。

  此款模型分为三个版本,并支援手机的离线使用:

  ✔Gemini Nano已经内置在Google Pixel 8 Pro中,提供在线/离线摘要功能以及在Gboard中的“智能回复”功能。

  ✔而对于Gemini Pro,已经在Bard系统中有专门的适应性调整,提供更高层次的推理、规划和理解能力。在多个行业标准基准测试中,Gemini Pro相较于GPT-3.5的6/8个版本都取得了显著超越,尤其是在MMLU和GSM8K(衡量小学数学推理能力)两类指标上。

  ✔此外,预计在2024年初,谷歌还会推出Bard Advanced,让用户首次接触到Gemini Ultra等先进模型和功能。

  据Pika1.0测评报告显示,AI视频应用迎来里程碑式创新!

  以全新的视觉效果出乎众望:与Discord早期版本相比,Pika采用的全新模型对于实现3D和2D动画效果效果惊艳且具有重做潜力。

  文生图及文生视频品质有着显著提高,并超越Runway。

  视频拓展功能展现出惊人的 boosted 效果:

  人工智能视频技术有望引领创作者经济时代的繁荣。

  关联企业包括:

  1)机器人生产经营者:柏楚电子和萤石网络等。

  2)正在研发或探寻AI视频相关项目的公司:美图公司、易点天下、焦点科技、果麦文化。

  3)在AI应用探索上产生突破的企业:昆仑万维、紫天科技、掌趣科技。

  4)有望提升影视产业工作效率的AI视频技术,关注华策影视和上海电影。

  5)相关计算相关标的:虹软科技、中科创达(aipc)、万兴科技、福昕软件和软通动力。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论