2026年6月1日,GTC台北与COMPUTEX同日开幕。黄仁勋这次没有再谈算力芯片全家桶,而是把聚光灯打向了物理世界——机器人、自动驾驶、以及一个会主动替你干活的”个人AI计算机”。同一天,上海传来MiniMax M3发布的消息,国产模型首次实现”编程+百万上下文+原生多模态”三项核心能力的合一。而就在上周,OpenAI用一个通用推理模型,推翻了困扰数学界80年的经典猜想。
三条线,指向同一个方向:AI正在从聊天框里走出来,进入物理世界、个人设备和科学前沿。
Cosmos 3:物理AI的”世界引擎”
英伟达在GTC台北发布了Cosmos 3——全球首个完全开源的全模态物理AI世界模型。与前代由多个专用模型拼凑而成的架构不同,Cosmos 3基于全新的Transformer混合架构,原生统一了文本、图像、视频、环境声音和动作的生成与理解。
关键指标:世界生成准确率在Artificial Analysis、Physics-IQ、PAI-Bench、R-Bench四项评测中均排名第一;动作策略在RoboLab和RoboArena评测中排名第一。
为什么这件事重要?因为物理AI一直卡在一个核心矛盾上:训练机器人和自动驾驶系统需要海量的真实物理交互数据,但采集真实数据的成本极高、周期极长。Cosmos 3将物理AI的训练和评估周期从数月压缩到数天——这意味着开发者可以在仿真环境中快速迭代,再迁移到真实世界。
黄仁勋对此的表述很直接:”得益于多模态推理语言、视觉和世界模型的突破,物理AI的爆发式增长指日可待。”
Isaac GR00T + 宇树:人形机器人有了”NVIDIA Inside”
伴随Cosmos 3发布的,还有Isaac GR00T人形机器人参考设计。英伟达宣布与宇树(Unitree)合作,将在2026年底推出基于该参考设计的H2 Plus人形机器人,同时与美国、欧洲及韩国的机器人制造商合作打造研究用途机器人。
这不是英伟达第一次涉足机器人,但这是它第一次为”人形机器人”提供从芯片到世界模型的完整参考架构。类比一下,就像当年Google提供Android参考设计给手机厂商——英伟达正在试图成为物理AI时代的”操作系统+芯片”双重基础设施。
国投证券指出,物理AI对应制造与物流产业重塑空间约50万亿美元;Coatue Management测算物理AI市场规模基准为6万亿美元。赛道足够大,但世界模型的实现方式尚未收敛——竞争才刚刚开始。
RTX Spark:PC的”智能体时刻”
如果说Cosmos 3负责物理世界,那RTX Spark瞄准的是每个人的桌面。
这颗超级芯片集成了Blackwell RTX GPU(6144个CUDA核心、第五代Tensor Core)与20核Grace CPU,通过NVLink-C2C互联,可提供1 Petaflop AI性能和最高128GB统一内存。能在本地运行120B参数、100万token上下文的大语言模型。
但比硬件参数更重要的是它与微软的合作定位——“全球首款专为个人智能体打造的Windows PC”。英伟达推出OpenShell运行时,微软提供全新Windows安全基元,共同构建端侧AI智能体的安全与隐私保护层。Hermes Agent和OpenClaw等开源智能体项目已率先集成。
Adobe正在为RTX Spark从底层重构Photoshop和Premiere。华硕、戴尔、惠普、联想、微软Surface、微星将在今年秋季推出搭载RTX Spark的轻薄笔记本。
黄仁勋的总结很精炼:”用户只要提出需求,剩下的交给PC来完成。这就是全新的PC——个人AI计算机。”
Alpamayo 2 Super:L4自动驾驶的”推理大脑”
自动驾驶线也在今天迎来重要更新。Alpamayo 2 Super是一款320亿参数的视觉-语言-动作(VLA)模型,相较前代100亿参数版本,参数量提升3倍,不再局限于轨迹生成,而是能在整套驾驶系统中完成推理、规划与执行。
黄仁勋的评价是:”Alpamayo标志着汽车开始具备自主推理能力,不再只是单纯行驶。”
配套发布的AlpaGym闭环强化学习平台和OmniDreams世界模型,能够大规模仿真各类罕见、长尾驾驶场景,解决自动驾驶中”见过才能应对”的数据瓶颈。
MiniMax M3:国产模型的”三合一”答卷
下午,MiniMax在上海发布了新一代旗舰模型M3。它的定位极其清晰——国内首个同时具备前沿编程能力、1M超长上下文、原生多模态三项核心能力的大模型,也是目前全球唯一具备完整能力组合的开源选项。
关键数据:
- SWE-Bench Pro编程评测:59.0%,超过GPT-5.5和Gemini 3.1 Pro,接近Claude Opus 4.7
- BrowseComp智能体评测:83.5,超越Opus 4.7(79.3)
- Agent评测Claw-Eval:最高分
- 多模态OmniDocBench:超过Gemini 3.1 Pro
底层突破在于自研的MSA(MiniMax Sparse Attention)稀疏注意力架构——在100万上下文规模下,单token计算量仅为上一代模型的1/20,prefilling阶段加速超9倍,decoding阶段加速超15倍。
MiniMax还同步更新了Agent产品MiniMax Code,其Agent集群可将大型任务拆解为多阶段、可并发、可动态调整的工作流,最长可连续自主运行数天。一个直观案例:研发人员将一篇ICLR 2025杰出论文交给M3独立复现,M3连续运行近12小时,产出18次commit与23张实验图表,成功跑通核心实验。
模型权重及技术报告将在10天内开源。商业化方面,API已开放,Plus版49元/月(6亿Token)、Max版119元/月(18亿Token)、Ultra版469元/月(55亿Token)。MiniMax同步启动A股IPO辅导,冲刺”大模型第一股”。
OpenAI推翻80年猜想:AI不再是”计算器”,而是”发现者”
上周的另一条重磅消息仍在持续发酵。OpenAI未对外发布的通用推理模型,自主完成了一份125页的原创数学证明,推翻了埃尔德什1946年提出的”平面单位距离猜想”。
这件事的意义不在于”AI又解了一道题”——而在于它展示了AI的科学发现模式与人类完全不同:人类数学家数十年来默认猜想成立,一直在寻找证明;而AI没有这种心理包袱,它尝试了大量看似荒谬的方向,最终将代数数论工具创新性地应用于离散几何——两个在学术圈几乎不交叉的领域。
菲尔兹奖得主蒂莫西·高尔斯评价:”如果这是人类写出的论文并投稿到Annals of Mathematics,我会毫不犹豫地建议接受发表。即便AI从此不再变得更聪明,我们也已经进入了一个新时代。”
OpenAI研究员塞巴斯蒂安·布贝克说了一句意味深长的话:”我们还没有看到那种足以与人类历史上最伟大的证明相提并论的天才火花。但有一点越来越清晰——AI已经完全有能力推动真正的科学发现。”
写在最后
如果要用一句话总结2026年6月1日的AI产业,那就是:AI正在同时向三个方向扩张——向下进入物理世界(机器人、自动驾驶),向近进入个人设备(RTX Spark PC),向上进入科学前沿(数学猜想)。
这不是一个方向上的加速,而是维度上的扩展。过去两年我们见证了语言模型的指数级增长;接下来两年,我们将见证AI长出”身体”、住进”桌面”、然后开始”搞科研”。
物理AI的50万亿美元市场叙事才刚刚开场。