Gemini上线，文化传媒+人工智能！

　　12月6日，谷歌宣布推出其认为规模最大、功能最强大的人工智能模型Gemini。Gemini将包括三种不同的套件: Gemini Ultra，Gemini Pro和Gemini Nano。

　　Gemini的诞生，意味着AI模型的巨大飞跃。据媒体报道，被ChatGPT压着打了整整一年，谷歌选择在12月的这一天，展开最强反击战。多模态Gemini，是‬迄今‬为止‬规模最大‬、能力‬最强的‬谷歌‬大模型‬，在‬文本‬、视频‬、语音‬等‬多个‬领域‬超越了‬GPT-4，可以说是‬一雪前耻‬，之后‬谷歌‬的所有产品‬，都将随之‬改头换面‬。

　　以前，多模态大模型就是将纯文本、纯视觉和纯音频模型拼接在一起，就像OpenAl的GPT-4。相比之下，在设计之初，多模态就是Gemini计划的一部分。从一开始，Gemini就在不同模态上进行了训练。随后，研究人员又用额外的多模态数据进行了微调，进一步提升了模型的有效性。最终，实现了【无缝】地理解和推理各种模态的输入内容。

　　可以‬确定的是‬，多模态‬是将是‬推动‬本轮‬AI热点‬继续‬前进‬的‬下一个‬增长点‬。预计‬下一代‬多模‬态‬将会‬快速‬拓展‬目前‬大语言‬模型‬有限的‬应用场景‬，显著‬提升‬语言模型‬的‬泛化‬能力‬，有望‬在成本方面‬展现出‬对‬传统‬专有‬模型‬的‬优势‬，从而‬推动‬如‬AI Agent‬等‬应用‬的落地‬，进而‬推动‬自动驾驶‬、机器人‬等‬应用‬获得‬革命性‬突破‬。

　　相关的上市公司：昆仑万维、拓尔思、万兴科技、云天励飞;

　　叠加近期短剧热度和AI应用降本增效的持续刺激，文化传媒板块持续走强;