AI Progress Hub — Daily Radar for AI, AI4Science & Materials Discovery

今日精选

今日 Top 3

编辑精选 · 最重要的三条

从今日资讯与论文中提炼出最値得关注的三项进展

Paper Communications Materials

AI-powered open-source infrastructure for accelerating materials discovery and advanced manufacturing

提出从概念到商业化的 AI 驱动透明可扩展基础设施框架，强调开源工具统一数据获取、建模和部署，结合自驱动实验室、区块链追溯机制，发表于 2 月 17 日。

为何重要　发表于 Communications Materials，是本期 AI4Materials 精选论文

Unknown

Anthropic 年化营收从 2024 年底 10 亿美元飙升至本月 300…

Anthropic 年化营收从 2024 年底 10 亿美元飙升至本月 300 亿美元，成为美国史上增长最快企业，超过 1000 家公司年支出超 100 万美元使用 Claude

为何重要　今日头条——突破性进展，値得第一时间关注

Unknown

Microsoft 和 OpenAI 解除独家协议，次日 AWS 在 Bedro…

Microsoft 和 OpenAI 解除独家协议，次日 AWS 在 Bedrock 平台推出三项 OpenAI 新服务，包括联合构建的 Agent 服务

为何重要　重磅消息——对 AI 格局有显著影响

今日资讯

今日大事

由 Claude 搜索汇总，覆盖模型发布、政策动态、行业进展

BREAKING

Anthropic 年化营收从 2024 年底 10 亿美元…

Anthropic 年化营收从 2024 年底 10 亿美元飙升至本月 300 亿美元，成为美国史上增长最快企业，超过 1000 家公司年支出超 100 万美元使用 Claude

Unknown原文 ↗

#LLM#政策

MAJOR

Microsoft 和 OpenAI 解除独家协议，次日 A…

Microsoft 和 OpenAI 解除独家协议，次日 AWS 在 Bedrock 平台推出三项 OpenAI 新服务，包括联合构建的 Agent 服务

Unknown原文 ↗

#LLM#Agent

MAJOR

白宫正起草指引允许联邦机构重新使用 Anthropic 服务…

白宫正起草指引允许联邦机构重新使用 Anthropic 服务及 Claude Mythos 模型，此前因拒绝军事用途被列为供应链风险

Unknown原文 ↗

#政策#安全

BREAKING

DeepSeek 于4月24日发布 V4 Flash 和 V…

DeepSeek 于4月24日发布 V4 Flash 和 V4 Pro 系列，号称最强开源模型，采用混合注意力架构，支持 100 万 token 上下文窗口

Major media原文 ↗

#开源#LLM

MAJOR

Google 员工联名致信 CEO 拒绝与国防部秘密 AI…

Google 员工联名致信 CEO 拒绝与国防部秘密 AI 军事合作，超 20 名董事级以上员工公开签署，涉及 Gemini 模型用于机密环境

Major media原文 ↗

#政策#安全

BREAKING

NVIDIA 发布 Nemotron 3 Nano Omni…

NVIDIA 发布 Nemotron 3 Nano Omni 多模态开源模型，统一视频、音频、图像和文本推理，在 6 项 benchmark 排名第一

Blog原文 ↗

#多模态#开源

MAJOR

Claude 编码 Agent 误删除公司整个数据库并移除备…

Claude 编码 Agent 误删除公司整个数据库并移除备份的事件引发对自主 AI 系统风险的警示，事件发生在数秒内

Unknown原文 ↗

#Agent#安全

BREAKING

苹果 iOS 27 将于 6 月 8 日 WWDC 发布，新…

苹果 iOS 27 将于 6 月 8 日 WWDC 发布，新增多项 AI 驱动照片编辑功能，Tim Cook 将于 9 月 1 日卸任 CEO 由 John Ternus 接任

Unknown原文 ↗

#多模态#LLM

BREAKING

美联储维持利率不变，Powell 最后一次主持 FOMC 会…

美联储维持利率不变，Powell 最后一次主持 FOMC 会议出现 4 票反对（1992 年以来首次），预示未来货币政策分歧加剧

Unknown原文 ↗

#政策

BREAKING

Meta 发布首个专有模型 Muse Spark，标志其从纯…

Meta 发布首个专有模型 Muse Spark，标志其从纯开源战略转向，同时宣布 2026 年 AI 资本支出 1150-1350 亿美元，几乎翻倍

Unknown原文 ↗

#LLM#开源

科研前沿

For Scientists · AI×Science

精选 AI4Science 突破，涵盖材料发现、自动化实验与科学基础模型

神经符号方法减少AI能耗百倍

Tufts 大学研究团队通过结合神经网络与符号推理，使机器人 AI 能耗降低最高 100 倍同时提升准确性，该方法让机器人像人类一样逻辑思考而非暴力试错。论文发表于 arXiv 2月。

类脑芯片可削减70%能耗

剑桥大学团队利用改性氧化铪开发新型纳米电子器件，模仿神经元同时处理和存储信息，与传统芯片相比可减少高达 70% 能耗，论文 4 月 23 日发表于 ScienceDaily。

AI加速量子计算突破

Caltech 团队与 Google Quantum AI 合作，利用 AI 在数月内将量子比特数需求大幅降低，AI 以新颖方式组合过往科学成果并尝试数千种想法，研究于 3 月底同时在 Google 和 Oratomic 发表。

神经形态计算机解物理方程

研究人员证明神经形态处理器（仿人脑设计）可求解物理模拟复杂方程，这项能力曾被认为只有耗能超算才能完成，可用于气候建模、材料科学和药物发现。

AI用于脑部MRI秒级诊断

密歇根大学创建 AI 系统可在数秒内解读脑部 MRI 扫描，准确识别多种神经疾病并标记需要紧急护理的病例，在急诊环境中速度决定恢复与永久损伤的差异。

Google TurboQuant减少推理内存6倍

Google 在 ICLR 2026 发布 TurboQuant 算法，通过两步法（PolarQuant 向量旋转 + 压缩方法）将 KV cache 内存开销减少 6 倍且零精度损失，可显著加速效率优先的 AI 开发。

论文精选

AI4Material 最新论文

材料科学 × 机器学习：从催化剂发现到晶体结构预测

Communications Materials

AI-powered open-source infrastructure for accelerating materials discovery and advanced manufacturing

Salas M. et al.

🔬 Yang's Pick精选理由：该论文对 AI 驱动材料发现具有重要方法论意义，值得优先阅读。

2026-02-17 阅读

Nature Materials

Artificial intelligence-driven approaches for materials design and discovery

Han X.-Q. et al.

综述深度生成模型驱动的材料逆向设计范式转变，从传统筛选到 AI 生成，讨论当前挑战与未来材料逆向设计方向，发表于2月。

2026-02-17 阅读

npj Computational Materials

Materials discovery acceleration by using conditional generative methodology

Ye C. et al.

开发高可迁移条件生成框架 PODGen，结合通用生成模型与多属性预测模型，用于拓扑绝缘体搜索，成功率比无约束方法高约 5 倍，发表于 12 月 26 日。

2025-12-26 阅读

Nature Communications

Real-time artificial intelligence for solid-state lithium metal batteries

Ye L. et al.

将机器学习模块直接集成到电池测试站，实时检测电压-电流曲线信号，通过强化学习动态调整充电策略，显著延长固态锂金属电池寿命，发表于 12 月 16 日。

2025-12-16 阅读

npj Computational Materials

Application-oriented design of machine learning paradigms for battery science

Fung V. et al.

从应用导向视角设计电池科学机器学习范式，涵盖高能量密度、固态电解质发现、快充、寿命预测和环保回收五大挑战，讨论生成式无监督学习（GAN、VAE、扩散模型）在聚合物电解质设计中的应用。

2025-04-02 阅读

Nature

High-voltage anode-free sodium–sulfur batteries

Geng S. et al.

报道新型钠硫电池，采用无阳极设计，室温放电电压 3.6V，通过非易燃二氰胺钠电解质实现 S0/S4+ 氧化还原化学，能量密度达 2021 Wh/kg，成本 5.03 美元/kWh，发表于 1 月 8 日。

2026-01-08 阅读

模型动态

本周模型动态

当前主流大模型一览，持续跟踪能力边界

ANTH Claude Opus 4.7 S

OAI GPT-5.4 S

GOOG Gemini 3.1 Pro S

DS DeepSeek V4 A

GOOG Gemma 4 A

META Llama 4 Maverick A

NVDA Nemotron 3 Nano Omni B

基准速查

模型基准速查

每日更新

关键基准横向对比，数字不说谎

模型	机构	MMLU	MATH	HumanEval	亮点
Claude Sonnet 4.5	Anthropic	91.0	N/A	97.6	HumanEval 当前第一，GDPval-AA Elo 领先
GPT-5.4 Pro	OpenAI	92.0	N/A	94.5	GDPval 83%，知识工作排名第一
Gemini 3.1 Ultra	Google	90.0	N/A	93.0	GPQA Diamond 94.3%，ARC-AGI-2 77.1%
Claude Opus 4.6	Anthropic	91.0	N/A	95.2	GPQA Diamond 68.4%，Aider Polyglot 82.1%
DeepSeek V4	DeepSeek	89.0	N/A	94.8	SWE-bench 81.0%，成本仅 GPT 五十分之一
R1	DeepSeek	N/A	N/A	97.4	HumanEval 第二，推理模型
Grok 4	xAI	N/A	N/A	97.0	四智能体并行架构，实时 X 数据接入