AI Progress Hub — Daily Radar for AI, AI4Science & Materials Discovery

今日精选

今日 Top 3

编辑精选 · 最重要的三条

从今日资讯与论文中提炼出最値得关注的三项进展

Paper Nature Machine Intelligence

Predicting new research directions in materials science using large language models and concept graphs

利用大语言模型从材料科学摘要构建语义概念图，训练机器学习模型从历史数据预测新兴主题组合，可提前2-3年识别研究趋势，为材料科学家提供研究灵感。

为何重要　发表于 Nature Machine Intelligence，是本期 AI4Materials 精选论文

Major media

五角大楼与 OpenAI、Google、微软、英伟达、亚马逊等七家科技巨头签署协…

五角大楼与 OpenAI、Google、微软、英伟达、亚马逊等七家科技巨头签署协议，在机密网络部署 AI 工具，Anthropic 因安全护栏争议被列入供应链风险名单，但白宫已重启谈判。

为何重要　今日头条——突破性进展，値得第一时间关注

Official

Sony AI 发布 Ace 乒乓球机器人，在《Nature》封面论文中展示首个…

Sony AI 发布 Ace 乒乓球机器人，在《Nature》封面论文中展示首个击败精英及职业选手的自主物理 AI 系统，标志着 AI 在高速物理交互领域的里程碑。

为何重要　重磅消息——对 AI 格局有显著影响

今日资讯

今日大事

由 Claude 搜索汇总，覆盖模型发布、政策动态、行业进展

BREAKING

五角大楼与 OpenAI、Google、微软、英伟达、亚马逊等七家科技巨头签署协议

Major media原文 ↗

#政策#安全

BREAKING

OpenAI 发布 GPT-5.5（4月23日）

OpenAI 发布 GPT-5.5（4月23日），仅6周后跟进 GPT-5.4，部署更严格的网络安全分类器，模型在代码生成、计算机使用和科研推理任务上表现领先。

Unknown原文 ↗

#LLM#开源

BREAKING

Google 发布 Gemini 3.1 Ultra

Google 发布 Gemini 3.1 Ultra，支持200万 token 原生多模态上下文窗口（文本、图像、音频、视频），并推出 Gemini 3.1 Flash-Lite 以2.5倍速度和45%更快输出降低成本至每百万 token 0.25美元。

Unknown原文 ↗

#LLM#多模态

MAJOR

华为 AI 芯片营收预计2026年达到120亿美元

华为 AI 芯片营收预计2026年达到120亿美元，同比增长60%，其 Ascend 950PR 订单激增，填补英伟达在中国市场的空白。

Unknown原文 ↗

#芯片

BREAKING

Sony AI 发布 Ace 乒乓球机器人

Sony AI 发布 Ace 乒乓球机器人，在《Nature》封面论文中展示首个击败精英及职业选手的自主物理 AI 系统，标志着 AI 在高速物理交互领域的里程碑。

Official原文 ↗

#机器人#AI4Science

BREAKING

Anthropic 推出 Project Glasswing

Anthropic 推出 Project Glasswing，联合主要科技公司和网络安全厂商建立联盟，保护关键软件安全，同时发布 Claude Opus 4.7 和内部测试的 Mythos 网络安全模型。

Unknown原文 ↗

#安全#LLM

BREAKING

Google 在 ICLR 2026 发布 TurboQuant 算法

Google 在 ICLR 2026 发布 TurboQuant 算法，通过 PolarQuant 和 Quantized Johnson-Lindenstrauss 压缩方法，将 KV 缓存内存开销降低6倍，显著提升大模型推理效率。

Unknown原文 ↗

#LLM

UPDATE

Novo Nordisk 与 OpenAI 达成战略合作

Novo Nordisk 与 OpenAI 达成战略合作，计划在2026年底前将 AI 全面整合到药物发现、临床试验、制造、供应链和商业运营，加速肥胖和糖尿病治疗药物开发。

Unknown原文 ↗

#生物#Agent

UPDATE

Meta 推出 Muse Spark

Meta 推出 Muse Spark，首个由新成立的超级智能实验室（负责人为前 Scale AI CEO 王亚历山大）开发的旗舰大模型，偏离过去的开源 Llama 策略，在多模态感知和推理任务上达到竞争性能且计算成本更低。

Unknown原文 ↗

#LLM

UPDATE

阿里巴巴 Happy Horse 1.0 视频生成模型在 Artificial Analysis Video Arena…

阿里巴巴 Happy Horse 1.0 视频生成模型在 Artificial Analysis Video Arena 匿名测试中以1389 Elo 分登顶榜首，150亿参数规模成为 AI 视频历史最高分，中国实验室主导视频生成赛道。

Blog原文 ↗

#多模态#开源

科研前沿

For Scientists · AI×Science

精选 AI4Science 突破，涵盖材料发现、自动化实验与科学基础模型

AI 发现等离子体新物理

埃默里大学团队结合专门设计的神经网络和粉尘等离子体（第四态物质）的3D 粒子追踪，揭示了粒子相互作用的隐藏模式，展示 AI 在基础物理发现中的潜力。

神经符号架构节能100倍

塔夫茨大学研究团队在 arXiv 发表论文，提出结合神经网络与符号推理的混合架构，在机器人结构化长期操作任务中将能耗降低至100倍，同时提升准确性。

AI 加速量子计算突破

Google 和量子计算初创公司 Oratomic 的论文显示，AI 辅助算法开发加速了能够破解互联网加密的量子计算机的到来时间，Cloudflare 已将量子防护截止日期提前至2029年。

世界模型迎来突破年

2026年被视为可靠世界模型和持续学习原型的突破年，Google DeepMind 的 Genie 3、World Labs 的 Marble 等系统在实时物理模拟和具身 AI 训练中取得进展。

AI 预测材料研究趋势

卡尔斯鲁厄理工学院团队在《Nature Machine Intelligence》发表研究，利用大语言模型和概念图谱系统分析材料科学论文，可提前2-3年预测新兴研究方向。

Novo Nordisk AI 药物发现

丹麦制药巨头 Novo Nordisk 与 OpenAI 合作，将 AI 整合到从药物发现、临床试验到制造和供应链的全业务流程，目标是在与礼来的竞争中加速肥胖和糖尿病新疗法开发。

论文精选

AI4Material 最新论文

材料科学 × 机器学习：从催化剂发现到晶体结构预测

Nature Machine Intelligence

Predicting new research directions in materials science using large language models and concept graphs

Marwitz T. et al.

🔬 Yang's Pick精选理由：该论文对 AI 驱动材料发现具有重要方法论意义，值得优先阅读。

2026-04-01 阅读

Nature Communications

AI-powered open-source infrastructure for accelerating materials discovery and advanced manufacturing

Authors et al.

提出构建透明、可扩展、可持续的 AI 驱动基础设施框架，从概念到商业化贯穿材料发现和先进制造全流程，强调开源工具统一数据获取、建模、仿真和部署以实现民主化访问。

2026-02-17 阅读

Nature Materials

Artificial intelligence-driven approaches for materials design and discovery

Authors et al.

综述过去几十年材料设计中的关键计算进展，突出从传统筛选方法到由深度生成模型驱动的逆向生成的范式转变，讨论材料逆向设计的当前挑战和未来前景。

2026-01-02 阅读

Angewandte Chemie

Accelerating Catalyst Materials Discovery With Large Artificial Intelligence Models

Zhang D. et al.

东北大学团队在特邀综述中强调大型 AI 模型（通用机器学习原子间势和大语言模型）如何重新定义催化剂发现，通过整合数据库、预测性能和自我改进循环，将发现周期从年缩短至周。

2026-03-07 阅读

Chemical Reviews

Reactive Machine Learning Interatomic Potentials for Chemistry and Materials Science

Authors et al.

全面综述反应性机器学习原子间势（MLIPs）在化学和材料科学中的应用，包括等变图神经网络（如 Allegro、PaiNN、MACE）在催化、表面科学和凝聚相化学中的最新成功案例。

2026-04-15 阅读

Nature Chemical Engineering

Machine learning speeds up heterogeneous catalysis simulations

Morandi S. et al.

西班牙加泰罗尼亚化学研究所团队通过结合编程和机器学习，实现异相催化模拟速度的显著提升，用于二氧化碳转化为燃料的反应，显著降低资源密集型过程的能源消耗。

2026-03-24 阅读

模型动态

本周模型动态

当前主流大模型一览，持续跟踪能力边界

OAI GPT-5.5 S

ANTH Claude Opus 4.7 S

GOOG Gemini 3.1 Ultra S

GOOG Gemma 4 A

META Muse Spark A

BABA Happy Horse 1.0 A

基准速查

模型基准速查

每日更新

关键基准横向对比，数字不说谎

模型	机构	MMLU	MATH	HumanEval	亮点
GPT-5.4	OpenAI	92.0	N/A	94.5	MMLU 和 LMArena 领先，通用推理最强
Claude Opus 4.6	Anthropic	91.0	N/A	95.2	GPQA Diamond 68.4%、SWE-bench 80.8% 领先
Gemini 3.1 Pro	Google	90.0	N/A	93.0	GPQA Diamond 94.3% 最高，科学推理强
DeepSeek V4	DeepSeek	89.0	N/A	94.8	SWE-bench 81.0%、LiveCodeBench 73.1% 领先
Claude Sonnet 3.5	Anthropic	N/A	N/A	93.7	HumanEval 第三，开发者满意度高