12月6日,谷歌宣布推出其认为规模最大、功能最强大的人工智能模型Gemini。Gemini将包括三种不同的套件: Gemini Ultra,Gemini Pro和Gemini Nano。
Gemini的诞生,意味着AI模型的巨大飞跃。据媒体报道,被ChatGPT压着打了整整一年,谷歌选择在12月的这一天,展开最强反击战。多模态Gemini,是迄今为止规模最大、能力最强的谷歌大模型,在文本、视频、语音等多个领域超越了GPT-4,可以说是一雪前耻,之后谷歌的所有产品,都将随之改头换面。
以前,多模态大模型就是将纯文本、纯视觉和纯音频模型拼接在一起,就像OpenAl的GPT-4。相比之下,在设计之初,多模态就是Gemini计划的一部分。从一开始,Gemini就在不同模态上进行了训练。随后,研究人员又用额外的多模态数据进行了微调,进一步提升了模型的有效性。最终,实现了【无缝】地理解和推理各种模态的输入内容。
可以确定的是,多模态是将是推动本轮AI热点继续前进的下一个增长点。预计下一代多模态将会快速拓展目前大语言模型有限的应用场景,显著提升语言模型的泛化能力,有望在成本方面展现出对传统专有模型的优势,从而推动如AI Agent等应用的落地,进而推动自动驾驶、机器人等应用获得革命性突破。
相关的上市公司:昆仑万维、拓尔思、万兴科技、云天励飞;
叠加近期短剧热度和AI应用降本增效的持续刺激,文化传媒板块持续走强;