AI Progress Hub — Daily Radar for AI, AI4Science & Materials Discovery

今日精选

今日 Top 3

编辑精选 · 最重要的三条

从今日资讯与论文中提炼出最値得关注的三项进展

Paper Nature

A generative model for inorganic materials design

Microsoft 等团队开发 MatterGen 生成模型，可直接生成满足性质约束的稳定无机材料，成功率是以往方法两倍，并可针对化学、力学、电磁性质微调

为何重要　发表于 Nature，是本期 AI4Materials 精选论文

Unknown

OpenAI CEO 萨姆·奥特曼出庭作证，反驳马斯克指控，称 Musk 曾要求…

OpenAI CEO 萨姆·奥特曼出庭作证，反驳马斯克指控，称 Musk 曾要求 90% 股权并提议将 OpenAI 传给子女

为何重要　今日头条——突破性进展，値得第一时间关注

Unknown

Anthropic 一季度营收年化增长 80 倍，CEO 称增长「太疯狂」，与…

Anthropic 一季度营收年化增长 80 倍，CEO 称增长「太疯狂」，与 SpaceX 合作获取 300+ MW 算力

为何重要　重磅消息——对 AI 格局有显著影响

今日资讯

今日大事

由 Claude 搜索汇总，覆盖模型发布、政策动态、行业进展

BREAKING

OpenAI CEO 萨姆·奥特曼出庭作证

OpenAI CEO 萨姆·奥特曼出庭作证，反驳马斯克指控，称 Musk 曾要求 90% 股权并提议将 OpenAI 传给子女

Unknown原文 ↗

#政策#LLM

MAJOR

Anthropic 一季度营收年化增长 80 倍

Anthropic 一季度营收年化增长 80 倍，CEO 称增长「太疯狂」，与 SpaceX 合作获取 300+ MW 算力

Unknown原文 ↗

#LLM#芯片

MAJOR

Anthropic Claude Mythos 模型发现数万软件漏洞

Anthropic Claude Mythos 模型发现数万软件漏洞，CEO 警告有 6-12 个月窗口期修复，中国 AI 追赶迅速

Unknown原文 ↗

#安全#LLM

BREAKING

OpenAI 发布 GPT-5.5 Instant

OpenAI 发布 GPT-5.5 Instant，成为 ChatGPT 新默认模型，减少 50% 幻觉率，并可搜索历史对话和文件

Major media原文 ↗

#LLM

BREAKING

Google 发布 Gemma 4 开源模型

Google 发布 Gemma 4 开源模型，针对高级推理与智能体工作流优化，已有 5 亿次下载量

Blog原文 ↗

#开源#LLM

UPDATE

黄仁勋在卡内基梅隆大学毕业演讲中称

黄仁勋在卡内基梅隆大学毕业演讲中称，毕业生正站在 AI 革命起点，这一时刻无比完美

Blog原文 ↗

#政策

BREAKING

中国四家 AI 实验室 12 天内发布开源编码模型

中国四家 AI 实验室 12 天内发布开源编码模型，包括 GLM-5.1、MiniMax M2.7、Kimi K2.6 和 DeepSeek V4

Unknown原文 ↗

#开源#LLM

UPDATE

Meta 宣布 AI 资本支出达 1150-1350 亿美元

Meta 宣布 AI 资本支出达 1150-1350 亿美元，几乎是去年两倍，并推出 Llama 4 小型专有模型

Unknown

#LLM#芯片

UPDATE

NVIDIA 与 Corning 合作将美国光纤产能提升 10 倍

NVIDIA 与 Corning 合作将美国光纤产能提升 10 倍，在北卡和德州建三家新厂，创造 3000+ 就业

Unknown

#芯片

UPDATE

澳大利亚 2026 年公有云支出将达 336 亿美元

澳大利亚 2026 年公有云支出将达 336 亿美元，同比增长 17.9%，AI 工作负载推动需求

Unknown原文 ↗

#LLM

科研前沿

For Scientists · AI×Science

精选 AI4Science 突破，涵盖材料发现、自动化实验与科学基础模型

AI 发现拓扑半金属

Nature Communications 报道了 Materials Expert-AI 框架，通过机器学习从实验数据中提取专家直觉，发现超价性是拓扑半金属的关键预测因子

MatterGen 生成无机材料

Nature 发表 Microsoft 等团队开发的 MatterGen 模型，可生成稳定且多样的无机材料，成功率是以往方法两倍以上，并可针对化学、对称性、力学等性质进行微调

AI 驱动材料逆向设计

Nature Materials 综述指出，材料设计已从传统筛选方法转向由深度生成模型驱动的逆向生成范式，讨论了当前挑战与未来方向

LLaMat 材料科学语言模型

Nature Machine Intelligence 报道印度理工学院团队开发的 LLaMat 领域语言模型，在 400 万篇材料科学论文上训练，42 项任务中超越 Claude、GPT 和 Gemini

开源 AI 基础设施加速材料

Nature Communications Materials 提出端到端 AI 框架，强调开源工具统一数据获取、建模、仿真和部署，民主化访问并促进可持续材料发现与先进制造

AI 与高性能计算加速发现

npj Computational Materials 综述 AI、HPC 和机器人自动化如何加速材料发现各阶段，通过提升数据生成、访问和推理能力实现规模化

论文精选

AI4Material 最新论文

材料科学 × 机器学习：从催化剂发现到晶体结构预测

Nature

A generative model for inorganic materials design

Merchant A. et al.

Microsoft 等团队开发 MatterGen 生成模型，可直接生成满足性质约束的稳定无机材料，成功率是以往方法两倍，并可针对化学、力学、电磁性质微调

🔬 Yang's Pick精选理由：该论文对 AI 驱动材料发现具有重要方法论意义，值得优先阅读。

2025-01-16 阅读

Nature Materials

Artificial intelligence-driven approaches for materials design and discovery

Han X.-Q. et al.

综述材料设计计算方法的范式转变，从传统筛选转向深度生成模型驱动的逆向设计，讨论当前挑战与未来方向

2026-02-17 阅读

Nature Communications Materials

AI-powered open-source infrastructure for accelerating materials discovery and advanced manufacturing

Authors et al.

提出透明、可扩展的 AI 驱动基础设施框架，从概念到商业化覆盖材料发现与先进制造，强调开源工具统一数据、建模、仿真和部署以促进协作与可持续性

2026-02-17 阅读

Nature Communications Materials

Materials Expert-Artificial Intelligence for materials discovery

Authors et al.

开发 ME-AI 机器学习框架，从实验数据中捕捉专家直觉为量化描述符，揭示超价性是拓扑半金属的关键预测因子

2025-09-29 阅读

Nature Machine Intelligence

LLaMat: A family of language models for materials science

Ahlawat D. et al.

印度理工学院团队在 400 万篇材料科学论文上持续预训练开发 LLaMat 领域语言模型，42 项任务中超越 Claude、GPT 和 Gemini，展现领域适应 AI 优势

2026-03-06 阅读

模型动态

本周模型动态

当前主流大模型一览，持续跟踪能力边界

OAI GPT-5.5 Instant S

ANTH Claude Opus 4.7 S

GOOG Gemma 4 A

XAI Grok 4.3 A

DS DeepSeek V4 A

ZHPU GLM-5.1 B

基准速查

模型基准速查

每日更新

关键基准横向对比，数字不说谎

模型	机构	MMLU	MATH	HumanEval	亮点
Claude Mythos Preview	Anthropic	N/A	N/A	N/A	GPQA Diamond 94.6% 领先
GPT-5	OpenAI	92.5	100.0	N/A	AIME 2026 满分
Gemini 3.1 Pro	Google	N/A	N/A	N/A	MMLU-Pro 89.8%，200 万 token 上下文
Claude Opus 4.7	Anthropic	N/A	N/A	N/A	SWE-bench Verified 80.9%
GPT-5.5 Instant	OpenAI	N/A	81.2	N/A	AIME 2025: 81.2%，MMMU-Pro: 76%
Grok 4.20	xAI	N/A	N/A	N/A	Mensa Norway IQ 145，并列第一
Kimi K2.6	Moonshot	N/A	N/A	N/A	GPQA 90.5%，开源权重领先