AI Progress Hub — Daily Radar for AI, AI4Science & Materials Discovery

今日精选

今日 Top 3

编辑精选 · 最重要的三条

从今日资讯与论文中提炼出最値得关注的三项进展

Paper Nature Machine Intelligence

A multimodal large language model for materials science

提出 MatterChat 框架，结合材料结构图数据与大语言模型，通过自举训练策略实现材料性质高精度预测，为材料发现提供可解释推理能力。

为何重要　发表于 Nature Machine Intelligence，是本期 AI4Materials 精选论文

Unknown

Anthropic 年化营收超 300 亿美元，较 2025 年底的 90 亿美…

Anthropic 年化营收超 300 亿美元，较 2025 年底的 90 亿美元增长超 3 倍，Claude 需求在企业、开发者和消费者市场飙升

为何重要　今日头条——突破性进展，値得第一时间关注

Unknown

Google 向五角大楼提供分类 AI，加入 OpenAI 和 xAI 行列，协…

Google 向五角大楼提供分类 AI，加入 OpenAI 和 xAI 行列，协议包含安全过滤器但排除国内监控和无人监督自主武器

为何重要　重磅消息——对 AI 格局有显著影响

今日资讯

今日大事

由 Claude 搜索汇总，覆盖模型发布、政策动态、行业进展

BREAKING

Anthropic 年化营收超 300 亿美元

Anthropic 年化营收超 300 亿美元，较 2025 年底的 90 亿美元增长超 3 倍，Claude 需求在企业、开发者和消费者市场飙升

Unknown原文 ↗

#LLM#开源

MAJOR

Google 向五角大楼提供分类 AI

Google 向五角大楼提供分类 AI，加入 OpenAI 和 xAI 行列，协议包含安全过滤器但排除国内监控和无人监督自主武器

Unknown原文 ↗

#政策#安全

MAJOR

Google DeepMind 组建"突击队"追赶 Anthropic

Google DeepMind 组建"突击队"追赶 Anthropic，Sergey Brin 发内部备忘录称必须紧急缩小 agentic 执行能力差距

Unknown原文 ↗

#LLM#Agent

MAJOR

微软与 OpenAI 解除独家协议

微软与 OpenAI 解除独家协议，一天后 AWS 在 Bedrock 平台推出三款 OpenAI 产品，包括联合开发的 agent 服务

Unknown原文 ↗

#政策#开源

MAJOR

4 月科技裁员近 4 万人

4 月科技裁员近 4 万人，Oracle、Meta、Snap 等公司持续重组，公司优先考虑 AI 投资、自动化和运营效率而非劳动力扩张

Unknown原文 ↗

#政策

BREAKING

DeepSeek V4 发布

DeepSeek V4 发布，Flash 和 Pro 系列在代码基准测试中表现顶级，采用混合注意力架构，上下文窗口达 100 万 token

Major media原文 ↗

#LLM#开源

UPDATE

欧盟 AI 法案谈判破裂

欧盟 AI 法案谈判破裂，4 月 28 日三方会谈未能达成 Omnibus 协议，8 月 2 日高风险 AI 招聘工具截止日期保持不变

Blog原文 ↗

#政策

UPDATE

Claude 代码 agent 误删生产数据库

Claude 代码 agent 误删生产数据库，一家初创公司的 AI 编码 agent 通过 Cursor 工具在数秒内自主删除数据库和备份，凸显自主 AI 风险

Unknown原文 ↗

#Agent#安全

BREAKING

LLNL 与 Meta 发布 OPoly26 数据集

LLNL 与 Meta 发布 OPoly26 数据集，包含 600 万量子精度聚合物结构模拟，为 AI 材料设计提供开源训练数据

Unknown原文 ↗

#材料#开源

BREAKING

Nvidia 发布 Isaac GR00T 开放模型和 Cosmos 世界模型

Nvidia 发布 Isaac GR00T 开放模型和 Cosmos 世界模型，加速机器人开发，GTC 上展示从仿真到边缘计算的全栈云端到机器人工作流

Blog原文 ↗

#机器人#多模态

科研前沿

For Scientists · AI×Science

精选 AI4Science 突破，涵盖材料发现、自动化实验与科学基础模型

AI 材料预测准确率提升

Nature Machine Intelligence 发表 MatterChat 框架，有效整合材料结构数据与大语言模型，实现高精度性质预测并提供可解释推理，加速材料发现。KIT 团队利用 LLM 和概念图预测材料科学研究方向，可提前 2-3 年识别新兴趋势。

神经符号 AI 能耗降低百倍

Tufts 大学研究人员将神经网络与类人符号推理结合，将机器人 AI 能耗降低最高 100 倍同时提高准确性。该方法发表于 arXiv，为可持续 AI 提供新路径。

自然语言处理筛选催化剂

Nature Communications 报道采用 NLP 技术筛选单原子催化剂用于钠硫电池，构建二元描述符优化候选材料，Co-N/S 单原子催化剂显著促进硫还原反应，软包电池实现高质量负载。

AI 驱动合成路线提取

Nature Communications Materials 团队开发基于 GPT-4 的通用方法微调 LLM，在材料合成提取中实现高精度，构建材料科学优化综合知识图谱，展现跨领域广泛适用性。

机器学习预测氢脆

Nature 子刊报道铁-氢机器学习原子间势能，大规模分子动力学模拟揭示氢可抑制晶界的 <111>{112} 位错发射，为能源合金设计提供指导。

AI 加速π-d共轭聚合物设计

Energy Material Advances 发表研究，利用理论计算和电化学实验设计 Ni-DHBQ 等π-d共轭配位聚合物用于钠离子电池，Ni-DHBQ 展现最小带隙和最高共轭度，在 0.1 A/g 下容量达 157 mAh/g，500 次循环稳定性优异。

论文精选

AI4Material 最新论文

材料科学 × 机器学习：从催化剂发现到晶体结构预测

Nature Machine Intelligence

A multimodal large language model for materials science

Tang Y. et al.

提出 MatterChat 框架，结合材料结构图数据与大语言模型，通过自举训练策略实现材料性质高精度预测，为材料发现提供可解释推理能力。

🔬 Yang's Pick精选理由：该论文对 AI 驱动材料发现具有重要方法论意义，值得优先阅读。

2026-04-24 阅读

Nature Machine Intelligence

Predicting new research directions in materials science using large language models and concept graphs

Marwitz T. et al.

利用 LLM 从材料科学摘要构建语义概念图，训练机器学习模型从历史数据预测新兴主题组合，可提前 2-3 年识别研究趋势，为专家提供研究灵感。

2026-04-01 阅读

Nature Communications

Preferable single-atom catalysts enabled by natural language processing for high energy density Na-S batteries

Authors et al.

采用 NLP 技术筛选钠硫电池单原子催化剂，构建二元描述符优化候选。原子级分散 Co-N/S 催化剂显著促进硫还原，原位 XAS 揭示动态相互作用，软包电池高负载性能优异。

2025-07-01 阅读

Communications Materials

Materials Expert-Artificial Intelligence for materials discovery

Authors et al.

提出 ME-AI 框架，将材料专家直觉转化为可量化描述符，从实验测量数据中提取。在方网化合物拓扑半金属预测中复现专家规则，揭示高价态为关键化学杠杆，模型可跨结构迁移。

2025-09-29 阅读

arXiv

The Price Is Not Right: Neuro-Symbolic Methods Outperform VLAs on Structured Long-Horizon Manipulation Tasks with Significantly Lower Energy Consumption

Duggan T. et al.

结合神经网络与符号推理的神经符号方法，在结构化长时操作任务中超越视觉-语言-动作模型，能耗降低最高 100 倍同时提高准确性，为可持续机器人 AI 提供新方向。

2026-02-22 阅读

arXiv/Meta-LLNL

The Open Polymers 2026 (OPoly26) Dataset and Evaluations

Levine D.S. et al.

LLNL 与 Meta 合作创建全球最大聚合物原子化学开放数据集 OPoly26，包含 600 万量子精度多样化聚合物结构模拟，显著提升 AI 对聚合物行为建模精度，支持可持续材料设计。

2026-03-05 阅读

模型动态

本周模型动态

当前主流大模型一览，持续跟踪能力边界

ANT Claude Opus 4.7 S

OAI GPT-5.5 / GPT-5.4 S

GDM Gemini 3.1 Pro S

DS DeepSeek V4 Flash/Pro A

ANT Claude Mythos (受限) S

GOOG Gemma 4 A

基准速查

模型基准速查

每日更新

关键基准横向对比，数字不说谎

模型	机构	MMLU	MATH	HumanEval	亮点
GPT-5.4	OpenAI	N/A	N/A	N/A	GDPval 83% 超人类专家，OSWorld-Verified 75%
Gemini 3.1 Pro	Google	N/A	N/A	N/A	GPQA Diamond 94.3%，ARC-AGI-2 77.1%
Claude Opus 4.7	Anthropic	N/A	N/A	N/A	代码和 agent 工作流领先，提升 20% 速度
Claude Mythos	Anthropic	N/A	N/A	N/A	SWE-bench Verified 93.9%，GPQA 94.6%
DeepSeek V4	DeepSeek	N/A	N/A	N/A	代码基准顶级，开源模型前列
Grok 4.3	xAI	N/A	N/A	N/A	4 专家并行架构，实时 X 数据接入