本周大事件不断。最大热点当属英伟达GTC大会。英伟达正式发布新一代AI芯片”Blackwell B200”,创始人黄仁勋称其为史上最成功的产品。
其他玩家也没有闲着。马斯克旗下AI初创公司xAI就开源了大模型Grok-1,其参数量高达3410亿。另一边,OpenAI终于有了新消息,据传将在年中推出 GPT-5。更为重磅的消息来自硬件玩家——苹果公司正积极与谷歌和OpenAI展开洽谈,希望将大模型引入iPhone。
硅谷的AI独角兽们就颇为动荡。Inflection AI创始人、谷歌 DeepMind 联合创始人即将加入微软的AI阵营。Stability AI依旧在风雨飘摇之中,继此前核心技术团队集体离职后,本周CEO也宣布跑路了。
国内本周舞台属于“长文本”(Long Context)。月之暗面正式宣布旗下Kimi智能助手已支持200万字超长无损上下文,在市场引起广泛关注;随后,阿里通义千问更新,免费开放1000万字长文档处理功能,百度、360智脑也相继宣布即将上线200万-500万字的长文本处理能力。在周末,通用大模型创业公司阶跃星辰正式对外亮相,发布Step-2万亿参数MoE语言大模型预览版。
Key Points
OpenAI有望年中推出GPT-5
苹果与谷歌、OpenAI谈合作,大模型或进iPhone
马斯克Grok-1开源,参数量3410亿
复现Sora,Colossal-AI发布开源项目“Open-Sora”
Stability.ai 发布 Stable Video 3D
Kimi智能助手支持200万字上下文,出圈爆火
大模型厂商「阶跃星辰」首亮相,已训万亿参数大模型
英伟达发布最强AI芯片
微软“雇佣式”收购Inflection AI,创始人加入微软
Stability AI核心团队闪崩,CEO辞职
苹果遭美国司法部反垄断诉讼
联合国通过首个全球AI决议
英伟达考虑收购以色列AI创企Run:ai
沙特计划设立400亿美元基金投资AI
「小英伟达」Astera Labs上市,募集6亿美金
Suno正式发布V3音乐生成模型
Adobe新研究:0.11秒从草图生成图像
大模型第一线
OpenAI有望年中推出GPT-5
据 The Business Insider 援引匿名知情人士消息,OpenAI 公司正计划筹备在今年年中推出 GPT-5,预计时间是夏季。此外,知情人士透露,一些企业客户已经提前体验了最新模型的演示以及与之相配套的 ChatGPT 增强功能。一位体验过 GPT-5 版本的 CEO 对其表现给出了高度评价:“它的表现非常出色,带来了明显的改进。”
苹果与谷歌、OpenAI谈合作,大模型或进iPhone
据彭博社最新报道,苹果公司正积极与谷歌和OpenAI展开深度谈判,旨在将这两家公司的生成式大型语言模型整合进iPhone的全新人工智能功能中,为未来的iOS 18系统奠定强大的底层框架。正式官宣预计要等到今年夏季之后。同时,3月23日消息,据《华尔街日报》报道,苹果与百度就在其中国设备中使用百度生成式AI技术进行了初步谈判。目前还无法确定苹果是否与其他中国生成式AI公司合作。
马斯克Grok-1开源,参数量3410亿
3月18日,马斯克旗下AI初创公司xAI宣布,其研发的大模型Grok-1正式对外开源开放,用户可直接通过磁链下载基本模型权重和网络架构信息。Grok-1是一个由xAI 2023年10月使用基于JAX和Rust的自定义训练堆栈、从头开始训练的3140亿参数的混合专家(MOE)模型,远超OpenAI的GPT模型。不过,此次开源的版本,是Grok-1预训练阶段的原始基础模型,没有针对任何特定应用(例如对话)进行微调。
复现Sora,Colossal-AI发布开源项目Open-Sora
继推出成本直降 46% 的 Sora 训练推理复现流程后,Colossal-AI团队全面开源全球首个类 Sora 架构视频生成模型 “Open-Sora 1.0”,涵盖了整个训练流程,包括数据处理、所有训练细节和模型权重,携手全球 AI 热爱者共同推进视频创作的新纪元。
Open-Sora 1.0 生成的都市繁华掠影
Stability.ai 发布 Stable Video 3D
Stability.ai发布Stable Video 3D,利用其多视图一致性来优化 3D 神经辐射场(NeRF)和网格表示,以提高直接从新颖视图生成的 3D 网格的质量,能够从任何给定角度提供连贯的视图,并具有熟练的概括能力。Stable Video 3D质量和多视图显著提高,性能优于之前发布的Zero 123XL等其他开源替代品。
Stable Video 3D生成效果
「Kimi智能助手」支持200万字上下文,出圈爆火
3月18日,大模型厂商“月之暗面”正式宣布,旗下Kimi智能助手已支持200万字超长无损上下文,并于即日起开启产品内测。21日下午,月之暗面旗下大模型应用Kimi的APP和小程序均无法正常使用。月之暗面表示,观测到Kimi的系统流量持续异常增高,远超对资源的预期规划。受到Kimi热度的催化,华策影视、掌阅科技、中广天择、福昕软件相关概念股股价持续攀升。
大模型厂商「阶跃星辰」首亮相,已训万亿参数大模型
3月23日,2024全球开发者先锋大会上,通用大模型创业公司阶跃星辰正式对外亮相。阶跃星辰研发的Step-1V 千亿参数多模态大模型,在中国权威的大型模型评估平台“司南”(OpenCompass)多模态模型评测榜单中位列第一。阶跃星辰创始人、CEO姜大昕博士在大会上正式对外发布了Step-2万亿参数大语言模型预览版,模型采用 MoE架构,聚焦深度智能的探索,并提供API接口给部分合作伙伴试用。
大事件
英伟达发布新一代AI芯片
3月18日-21日期间,英伟达在美国圣何塞召开GTC大会,发布下一代芯片架构Blackwell,这一GPU平台也是黄仁勋口中,英伟达史上最成功的产品。据介绍,Blackwell GPU以数学家David Harold Blackwell的名字命名,同样沿用了英伟达此前推出的Hopper架构。Blackwell GPU中包含2080亿个晶体管,可支持多达10万亿个参数的AI模型。
微软“雇佣式”收购Inflection AI,创始人加入微软
3月19日,微软正式宣布,人工智能初创公司Inflection AI 的 Mustafa Suleyman 和 Karén Simonyan 及其他大部分员工将加入Microsoft AI,专注于面向消费者的 AI 产品和研究。3月22日,据知情人士透露,微软已同意向Inflection AI支付约6.5亿美元,主要以许可协议的形式,使Inflection AI的模型可以在Azure 云服务上销售。这意味着,以雇用核心团队成员加上“模型授权费”之名,微软只实质上完成了对Inflection这家估值一度在AI排行榜上名列第三(仅次于OpenAI和Anthropic)的公司的收购。
Stability AI核心团队闪崩,CEO辞职
当地时间3月23日,独角兽AI公司Stability AI称,宣布公司 CEO Emad Mostaque 辞职。Emad Mostaque 在社媒平台 X 上宣布,自己离职后将致力于去中心化人工智能(Decentralized AI)。本周早些时候,核心研发团队已集体辞职。Stability AI因开发了文生图大模型Stable Diffusion而知名,创立于2020年底,2022年估值一度高达10亿美元。
苹果遭美国司法部反垄断诉讼,市值蒸发1100亿美元
路透社消息,当地时间3月21日,美国司法部长梅里克·加兰在当天的新闻发布会上表示,美国司法部和十几个州的总检察长对苹果公司提起反垄断诉讼,指控苹果公司利用其对苹果产品硬件和软件的控制垄断手机市场,损害了消费者、开发商和竞争对手公司的利益。受此消息影响,苹果当天股价大跌4.09%,市值蒸发超过1100亿美元(约8000亿元人民币),总市值回落至2.65万亿美元。
联合国通过首个全球AI决议
当地时间3月21日,联合国大会投票通过了第一个有关人工智能(AI)的决议草案,以确保这项新技术能够惠及所有国家、尊重人权并且是“安全、可靠和值得信赖的”技术。据悉,美国为这项决议草案的发起国,中国参与了共同提案。
融资动态
英伟达考虑收购以色列AI创企Run:ai
以色列经济学家报消息,3月17日,英伟达被曝正洽谈收购以色列人工智能基础设施平台Run:ai,交易价值可能达到10亿美元。Run:ai 由首席执行官 Omri Geller 和首席技术官 Ronen Dar 博士于 2018 年成立。2022 年 3 月,Run:ai 在 C 轮中筹集 7500 万美元,由老虎环球基金(Tiger Global Management)和 洞见创投(Insight Partners) 领投。
沙特计划设立400亿美元基金投资AI
据纽约时报,三位了解计划的人士透露,沙特阿拉伯政府计划创建一支约400亿美元的基金,用于投资人工智能(AI)技术。若顺利成立,这支基金将使沙特成为全球最大的AI投资者。知情人士表示,最近几周,沙特公共投资基金(PIF)的代表已经与硅谷最成功的风投公司Andreessen Horowitz(a16z)等金融机构讨论了潜在合作伙伴关系,议题包括基金如何运作及a16z可发挥的作用。
「小英伟达」Astera Labs上市,募集6亿美金
3月20日,芯片制造商Astera Labs在美国纳斯达克上市,募资6亿美元。借AI的东风,投行将Astera Labs包装成“小英伟达”的概念,这使Astera Labs深受市场追捧。Astera Labs核心产品之一是数据和内存连接半导体,可有效提升软硬件之间的连接效率和速度,客户包括行业巨头如亚马逊和微软。其上市首日收盘价为62.03美元,较发行价上涨72.31%,以收盘价计算,公司市值约94.59亿美元。
新玩意
Suno正式发布V3音乐生成模型
AI音乐生成创企Suno正式发布文生音乐模型v3,该模型可在几秒钟内创建完整的两分钟歌曲。该工具可以通过其免费的独立网站访问,也可以通过启用Suno的第三方插件Microsoft Copilot访问。用户只需要简单的文字描述,就能创作出具备专业水准的音乐。
Suno界面
体验地址:https://app.suno.ai
前沿研究
Adobe新研究:0.11秒从草图生成图像
3月19日,来自CMU、Adobe的团队在arXiv上发表论文,提出一种图像推理方法。据介绍,该方法解决了现有条件扩散模型的两个限制:由于迭代去噪过程导致的推断速度较慢、对配对数据进行模型微调的依赖。为了解决这些问题,作者引入了一种通用方法,通过对抗学习目标将单步扩散模型适应于新的任务和领域,既能利用预训练扩散模型的内部知识,同时还能实现高效的推理。对于512*512的图像,在A6000上生成时间为0.29秒,在A100上为0.11秒。