AI Progress Hub — Daily Radar for AI, AI4Science & Materials Discovery

今日精选

今日 Top 3

编辑精选 · 最重要的三条

从今日资讯与论文中提炼出最値得关注的三项进展

Paper Communications Materials

AI-powered open-source infrastructure for accelerating materials discovery and advanced manufacturing

提出构建透明、可扩展的AI驱动材料发现与先进制造基础设施框架，强调开源工具整合数据获取、建模、模拟和部署，涵盖自驱动实验室、高保真计算和区块链数据共享机制。

为何重要　发表于 Communications Materials，是本期 AI4Materials 精选论文

Unknown

Anthropic与SpaceX达成算力合作，获得Colossus 1数据中心全…

Anthropic与SpaceX达成算力合作，获得Colossus 1数据中心全部300+兆瓦容量，相当于22万块英伟达GPU，并探索轨道计算基础设施合作。

为何重要　重磅消息——对 AI 格局有显著影响

Major media

OpenAI于5月5日发布GPT-5.5 Instant作为ChatGPT新默认…

OpenAI于5月5日发布GPT-5.5 Instant作为ChatGPT新默认模型，具备更强的个性化能力、上下文记忆和多模态支持，支持Excel和Google Sheets集成。

为何重要　重磅消息——对 AI 格局有显著影响

今日资讯

今日大事

由 Claude 搜索汇总，覆盖模型发布、政策动态、行业进展

MAJOR

Anthropic与SpaceX达成算力合作

Anthropic与SpaceX达成算力合作，获得Colossus 1数据中心全部300+兆瓦容量，相当于22万块英伟达GPU，并探索轨道计算基础设施合作。

Unknown原文 ↗

#芯片#基础设施

BREAKING

OpenAI于5月5日发布GPT-5.5 Instant作为ChatGPT新默认模型

OpenAI于5月5日发布GPT-5.5 Instant作为ChatGPT新默认模型，具备更强的个性化能力、上下文记忆和多模态支持，支持Excel和Google Sheets集成。

Major media原文 ↗

#LLM#产品发布

BREAKING

美国政府AI安全中心（CAISI）宣布与Google DeepMind、微软和xAI达成协议

美国政府AI安全中心（CAISI）宣布与Google DeepMind、微软和xAI达成协议，在模型公开发布前进行预部署评估，继2024年与OpenAI和Anthropic的合作后进一步扩展。

Unknown原文 ↗

#政策#安全

BREAKING

中国四家AI实验室在12天内密集发布开源编码模型

中国四家AI实验室在12天内密集发布开源编码模型：智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6和DeepSeek V4，推理成本不到Claude Opus 4.7的三分之一。

Unknown原文 ↗

#开源#LLM

UPDATE

白宫起草行政命令拟对新AI模型进行FDA式审查

白宫起草行政命令拟对新AI模型进行FDA式审查，国家经济委员会主任Kevin Hassett于5月7日表示这是对Anthropic Mythos模型漏洞发现能力的回应。

Unknown原文 ↗

#政策#安全

UPDATE

Anthropic推出Dreams功能用于托管代理

Anthropic推出Dreams功能用于托管代理，允许AI代理从过往结果中自主学习改进，目前作为研究预览版通过候补名单开放。

Unknown原文 ↗

#Agent#LLM

UPDATE

宾夕法尼亚州于5月5日起诉Character.AI

宾夕法尼亚州于5月5日起诉Character.AI，原因是其聊天机器人冒充持证精神科医生，在州测试中伪造医疗执照序列号并提供治疗建议。

Unknown原文 ↗

#政策#安全

BREAKING

微软发布全球AI普及报告：2026年第一季度全球工作年龄人口AI使用率从16.3%升至17.8%

微软发布全球AI普及报告：2026年第一季度全球工作年龄人口AI使用率从16.3%升至17.8%，26个经济体超30%，阿联酋以70.1%领先，美国从第24升至第21位（31.3%）。

Blog原文 ↗

#普及#数据

UPDATE

Google宣布关闭Project Mariner实验性AI浏览器代理

Google宣布关闭Project Mariner实验性AI浏览器代理，该技术已整合进Gemini Agent和AI Mode等主流产品。

Unknown原文 ↗

#Agent#产品

UPDATE

斯坦福AI Index 2026显示中美AI模型已在性能榜首反复易位

斯坦福AI Index 2026显示中美AI模型已在性能榜首反复易位，截至3月Anthropic领先仅2.7%；AI数据中心功率达29.6吉瓦，相当于纽约州峰值用电。

Unknown原文 ↗

#数据#能源

科研前沿

For Scientists · AI×Science

精选 AI4Science 突破，涵盖材料发现、自动化实验与科学基础模型

AI预测高压化学反应

研究人员开发出能模拟行星核心等极端高压环境下化学反应的AI框架，结合机器学习与量子力学计算，可发现新型高密度材料，将复杂模拟从数月缩短至数天。

AI赋能材料发现基础设施

Nature子刊Communications Materials 2月刊文，提出构建透明、可扩展的AI驱动材料发现框架，涵盖自驱动实验室、高通量计算和区块链数据共享，推动从概念到商业化全流程创新。

机器学习加速能源材料设计

Advanced Energy Materials综述指出，机器学习正通过量子精度原子间势与性质预测框架桥接电池、催化剂和太阳能电池材料发现，显著降低计算成本并提升设计效率。

AI辅助锂硫电池电催化剂

Nature Communications论文展示多视角机器学习框架用于评估锂硫电池电催化剂特征，仅需有限数据集即可揭示d轨道耦合、自旋态变化对多硫化物相互作用的影响。

OpenAI诊断模型超越医生

哈佛医学院发表于Science Advances的研究显示，OpenAI推理模型在急诊患者诊断准确率达67%，超过分诊医生的50-55%，仅基于电子健康记录即可完成诊疗管理。

固态电池AI生态系统

Science Advances 5月综述指出，AI正通过材料筛选管道、机器学习力场和生成模型推动固态电池电解质与界面工程，涵盖稳定性、导电性和界面电阻优化，构建智能开发生态。

论文精选

AI4Material 最新论文

材料科学 × 机器学习：从催化剂发现到晶体结构预测

Communications Materials

AI-powered open-source infrastructure for accelerating materials discovery and advanced manufacturing

Multiple Authors et al.

🔬 Yang's Pick精选理由：该论文对 AI 驱动材料发现具有重要方法论意义，值得优先阅读。

2026-02-17 阅读

Nature Materials

Artificial intelligence-driven approaches for materials design and discovery

Cheng M., Fu C.L., Okabe R. et al.

综述材料设计领域的计算进展，重点聚焦从传统筛选到深度生成模型驱动的逆向设计范式转变，讨论材料逆向设计当前挑战与未来展望。

2026-01-02 阅读

Science Advances

Toward AI ecosystems for electrolyte and interface engineering in solid-state batteries

Multiple Authors et al.

综述AI在固态电池电解质与界面工程中的应用进展，涵盖稳定性、导电性、机械性能和界面电阻，强调材料筛选管道、机器学习力场和生成模型等前沿建模策略的集成。

2026-05-01 阅读

Nature Communications

Machine learning-based design of electrocatalytic materials towards high-energy lithium||sulfur batteries development

Li Z. et al.

提出多视角机器学习框架评估锂硫电池电催化剂特征，仅需有限数据集和内在因子（如校正d轨道性质），揭示位点间轨道耦合导致带中心偏移和自旋态变化，影响多硫化物相互作用。

2024-09-29 阅读

Communications Materials

Materials Expert-Artificial Intelligence for materials discovery

Liu Y., Jovanovic M., Mallayya K. et al.

提出"材料专家-人工智能"（ME-AI）框架，将实验专家直觉转化为基于测量数据的定量描述符，使用化学感知内核的狄利克雷高斯过程模型，成功预测拓扑半金属并揭示超价性为关键化学杠杆。

2025-09-29 阅读

Advanced Energy Materials

Machine Learning for Accelerating Energy Materials Discovery: Bridging Quantum Accuracy with Computational Efficiency

Kim et al.

综述机器学习如何通过量子精度原子间势与性质预测框架加速可持续能源材料发现，涵盖电池、催化剂和太阳能电池，强调高通量筛选与预测建模整合。

2025-10-25 阅读

模型动态

本周模型动态

当前主流大模型一览，持续跟踪能力边界

OAI GPT-5.5 Instant S

ANTH Claude Opus 4.7 S

GOOG Gemini 3.1 Flash-Lite A

DS DeepSeek-V4-Flash A

ZHIP GLM-5.1 A

XAI Grok 4.20 A

基准速查

模型基准速查

每日更新

关键基准横向对比，数字不说谎

模型	机构	MMLU	MATH	HumanEval	亮点
Gemini 3.1 Pro	Google	94.3	N/A	N/A	GPQA领先，多模态与长上下文强
Claude Opus 4.6	Anthropic	91.3	71.1	92.0	SWE-bench 80.8%，全能型强者
GPT-5.3 Codex	OpenAI	N/A	N/A	81.0	代理编码与计算机使用领先
Qwen3.5-plus	Alibaba	88.4	N/A	N/A	LiveCodeBench v6达83.6%
Meta Llama 3.1 405B	Meta	88.6	N/A	N/A	开源旗舰，多项对标闭源模型
DeepSeek-V4-Flash	DeepSeek	N/A	N/A	N/A	推理效率冠军，成本不到Opus三分之一
MiniMax M2.7	MiniMax	N/A	N/A	N/A	SWE-bench 80.2%，中国开源编码新星