AI Progress Hub — Daily Radar for AI, AI4Science & Materials Discovery

今日精选

今日 Top 3

编辑精选 · 最重要的三条

从今日资讯与论文中提炼出最値得关注的三项进展

Paper Communications Materials

AI-powered open-source infrastructure for accelerating materials discovery and advanced manufacturing

提出从概念到商业化的AI驱动材料发现框架，强调开源工具统一数据采集、建模、仿真与部署，整合自驱动实验室与区块链机制实现安全数据共享。

为何重要　发表于 Communications Materials，是本期 AI4Materials 精选论文

Blog

Anthropic的Claude Mythos模型因卓越网络安全能力引发争议，能…

Anthropic的Claude Mythos模型因卓越网络安全能力引发争议，能自主发现并利用零日漏洞，仅限12家合作机构使用

为何重要　今日头条——突破性进展，値得第一时间关注

Unknown

Anthropic推出金融行业10个预配置AI代理，并发布Claude Opus…

Anthropic推出金融行业10个预配置AI代理，并发布Claude Opus 4.7及完整Microsoft 365集成，年营收达300亿美元超越OpenAI

为何重要　重磅消息——对 AI 格局有显著影响

今日资讯

今日大事

由 Claude 搜索汇总，覆盖模型发布、政策动态、行业进展

BREAKING

Anthropic推出金融行业10个预配置AI代理

Anthropic推出金融行业10个预配置AI代理，并发布Claude Opus 4.7及完整Microsoft 365集成，年营收达300亿美元超越OpenAI

Unknown原文 ↗

#Agent#LLM

MAJOR

美国商务部宣布与Google DeepMind、Microsoft、xAI达成协议

美国商务部宣布与Google DeepMind、Microsoft、xAI达成协议，允许政府在模型公开前进行评估，强化AI安全审查

Major media原文 ↗

#政策#安全

BREAKING

Anthropic的Claude Mythos模型因卓越网络安全能力引发争议

Anthropic的Claude Mythos模型因卓越网络安全能力引发争议，能自主发现并利用零日漏洞，仅限12家合作机构使用

Blog原文 ↗

#安全#Agent

BREAKING

OpenAI GPT-5.5于4月23日发布

OpenAI GPT-5.5于4月23日发布，仅6周后推出GPT-5.4，专注自主编程与计算机使用，在OSWorld-V基准达75%超越人类基线

Unknown原文 ↗

#LLM#Agent

MAJOR

美国参议员Sanders和AOC提出AI数据中心暂停法案

美国参议员Sanders和AOC提出AI数据中心暂停法案，要求在制定能源与劳工标准前冻结新建大型AI数据中心

Blog原文 ↗

#政策#芯片

BREAKING

中国开源编程模型集中爆发：DeepSeek-V4、GLM-5.1、Kimi K2.6在12天内发布

中国开源编程模型集中爆发：DeepSeek-V4、GLM-5.1、Kimi K2.6在12天内发布，推理成本不到Claude Opus 4.7的三分之一

Unknown原文 ↗

#开源#LLM

BREAKING

Google发布TurboQuant算法（ICLR 2026）

Google发布TurboQuant算法（ICLR 2026），通过KV缓存压缩将大模型内存开销降低100倍，推动效率优先AI开发

Unknown原文 ↗

#LLM#芯片

UPDATE

哈佛研究显示OpenAI o1模型急诊诊断准确率67%超越分诊医生的50-55%

哈佛研究显示OpenAI o1模型急诊诊断准确率67%超越分诊医生的50-55%，AI医疗应用进入临床部署阶段

Unknown原文 ↗

#多模态#生物

UPDATE

Novo Nordisk与OpenAI达成战略合作

Novo Nordisk与OpenAI达成战略合作，计划2026年底前将AI全面整合至药物研发、临床试验、制造及供应链

Unknown原文 ↗

#生物#Agent

UPDATE

五角大楼与SpaceX、OpenAI、Google等8家公司达成协议在机密网络部署AI工具

五角大楼与SpaceX、OpenAI、Google等8家公司达成协议在机密网络部署AI工具，Anthropic因安全条款分歧被排除

Major media原文 ↗

#政策#安全

科研前沿

For Scientists · AI×Science

精选 AI4Science 突破，涵盖材料发现、自动化实验与科学基础模型

AI语言模型指导化学合成

新AI系统Synthegy让化学家用自然语言指导合成与反应规划，强大算法自动生成合成路线并优化参数，大幅缩短复杂分子设计周期。

DNA机器人递送药物与捕获病毒

DNA折叠技术结合传统机器人学理念，开发可编程纳米级DNA机器人，能在体内递送药物、捕获病毒并构建分子级设备。

AI预测番茄采摘难度优化收获

新型番茄采摘机器人通过AI预测每个番茄的采摘难度而非仅识别成熟度，据此调整策略，显著提高农业自动化效率。

神经形态计算机求解物理方程

模仿人脑的神经形态计算机现可求解复杂物理模拟背后的方程，这项工作曾被认为只有高耗能超算才能完成，能耗降低显著。

AI数秒读取脑部MRI识别紧急情况

密歇根大学开发的AI系统可在数秒内解读脑部MRI扫描，准确识别多种紧急情况，大幅加速诊断流程。

NVIDIA发布Isaac GR00T机器人模型

NVIDIA在国家机器人周发布Isaac GR00T开放模型，使机器人能理解自然语言指令并执行复杂多步任务，加速物理AI部署。

论文精选

AI4Material 最新论文

材料科学 × 机器学习：从催化剂发现到晶体结构预测

Communications Materials

AI-powered open-source infrastructure for accelerating materials discovery and advanced manufacturing

Multiple authors et al.

提出从概念到商业化的AI驱动材料发现框架，强调开源工具统一数据采集、建模、仿真与部署，整合自驱动实验室与区块链机制实现安全数据共享。

🔬 Yang's Pick精选理由：该论文对 AI 驱动材料发现具有重要方法论意义，值得优先阅读。

2026-02-17 阅读

Nature Machine Intelligence

Predicting new research directions in materials science using large language models and concept graphs

Marwitz T. et al.

利用大语言模型和机器学习系统分析材料科学文献，通过概念图映射关系预测2-3年内的新兴研究趋势，为材料发现提供前瞻指导。

2026-04-01 阅读

Nature Machine Intelligence

LLaMat: Domain-adapted language models for materials science

Ahlawat D. et al.

基于数百万材料论文训练的领域专用语言模型家族，在关键科学任务上超越GPT-4o、Gemini和Claude等通用LLM，提供更高效的材料AI助手。

2026-03-06 阅读

Communications Materials

Materials Expert-Artificial Intelligence for materials discovery

Multiple authors et al.

提出ME-AI框架，从实验数据中提取量化描述符捕捉专家直觉，揭示超价态作为拓扑半金属关键预测因子，弥合计算数据库与实验结果差距。

2025-09-29 阅读

Discover Applied Sciences

Artificial intelligence integration in materials science

Abu-Shams M. et al.

综述AI在材料科学的变革性影响，涵盖化学信息学、成像、药物发现与增材制造进展，重点介绍ChatMOF、MatKG、MatterGen等新兴AI工具。

2026-01-20 阅读

NeurIPS 2026

Mollifier Layers for inverse partial differential equations in scientific AI

Penn researchers et al.

宾夕法尼亚大学提出Mollifier层技术，将经典平滑函数集成入神经网络求解逆向偏微分方程，应用于基因组学、材料科学、气候建模与染色质生物学。

2026-03-15 阅读

模型动态

本周模型动态

当前主流大模型一览，持续跟踪能力边界

ANTH Claude Opus 4.7 S

OAI GPT-5.5 S

GOOG Gemini 3.1 Ultra S

DS DeepSeek-V4-Flash A

ZAI GLM-5.1 A

GOOG Gemma 4 B

基准速查

模型基准速查

每日更新

关键基准横向对比，数字不说谎

模型	机构	MMLU	MATH	HumanEval	亮点
Gemini 3.1 Pro	Google	94.3	N/A	N/A	GPQA-Diamond领跑94.3%，多模态推理顶尖
Claude Opus 4.6	Anthropic	91.3	N/A	93.7	HLE工具辅助53.1%，企业定位14/15分
GPT-5.3 Codex	OpenAI	N/A	N/A	N/A	GPQA 81%，编程与推理均衡
Claude 3.5 Sonnet	Anthropic	N/A	N/A	93.7	HumanEval 93.7%，开发者首选
Qwen3.5-plus	Alibaba	88.4	N/A	N/A	GPQA 88.4%，中文多模态强
DeepSeek-R1	DeepSeek	N/A	N/A	N/A	2025年2月曾匹敌美国顶级模型
Kimi K2 0905	Moonshot AI	N/A	N/A	94.5	HumanEval 94.5%，编程任务领先