Gemini模型问世，多模态处理能力攀新峰

　　在2023年12月6日晚上，谷歌发布一款新型模型——Gemini，涵盖了Ultra、Pro和Nano三个不同大小的优化版本。

　　此款模型的优势在于它能够出色地处理多项任务。

　　其表现优于GPT4和mmlu能力。

　　据称，Gemini成为首个在MMLU(大范围多任务语言理解)领域胜过人类专家模型的平台。并在30/32项学术基准中保持领先地位，涉及数学、物理和历史在内57个科目。

　　Gemini采用了全面的多元模式设计，支持预训练及额外多模态数据微调，进一步提升了对各类输入的理解与推论能力。

　　此款模型分为三个版本，并支援手机的离线使用：

　　✔Gemini Nano已经内置在Google Pixel 8 Pro中，提供在线/离线摘要功能以及在Gboard中的“智能回复”功能。

　　✔而对于Gemini Pro，已经在Bard系统中有专门的适应性调整，提供更高层次的推理、规划和理解能力。在多个行业标准基准测试中，Gemini Pro相较于GPT-3.5的6/8个版本都取得了显著超越，尤其是在MMLU和GSM8K(衡量小学数学推理能力)两类指标上。

　　✔此外，预计在2024年初，谷歌还会推出Bard Advanced，让用户首次接触到Gemini Ultra等先进模型和功能。

　　据Pika1.0测评报告显示，AI视频应用迎来里程碑式创新!

　　以全新的视觉效果出乎众望：与Discord早期版本相比，Pika采用的全新模型对于实现3D和2D动画效果效果惊艳且具有重做潜力。

　　文生图及文生视频品质有着显著提高，并超越Runway。

　　视频拓展功能展现出惊人的 boosted 效果：

　　人工智能视频技术有望引领创作者经济时代的繁荣。

　　关联企业包括：

　　1)机器人生产经营者：柏楚电子和萤石网络等。

　　2)正在研发或探寻AI视频相关项目的公司：美图公司、易点天下、焦点科技、果麦文化。

　　3)在AI应用探索上产生突破的企业：昆仑万维、紫天科技、掌趣科技。

　　4)有望提升影视产业工作效率的AI视频技术，关注华策影视和上海电影。

　　5)相关计算相关标的：虹软科技、中科创达(aipc)、万兴科技、福昕软件和软通动力。