AI 材料预测准确率提升
Nature Machine Intelligence 发表 MatterChat 框架,有效整合材料结构数据与大语言模型,实现高精度性质预测并提供可解释推理,加速材料发现。KIT 团队利用 LLM 和概念图预测材料科学研究方向,可提前 2-3 年识别新兴趋势。
A daily radar for AI · AI4Science · Materials Discovery
Track frontier model releases, scientific ML breakthroughs, materials discovery, benchmarks, and conference deadlines — updated daily.
从今日资讯与论文中提炼出最値得关注的三项进展
提出 MatterChat 框架,结合材料结构图数据与大语言模型,通过自举训练策略实现材料性质高精度预测,为材料发现提供可解释推理能力。
Anthropic 年化营收超 300 亿美元,较 2025 年底的 90 亿美元增长超 3 倍,Claude 需求在企业、开发者和消费者市场飙升
Google 向五角大楼提供分类 AI,加入 OpenAI 和 xAI 行列,协议包含安全过滤器但排除国内监控和无人监督自主武器
由 Claude 搜索汇总,覆盖模型发布、政策动态、行业进展
Anthropic 年化营收超 300 亿美元,较 2025 年底的 90 亿美元增长超 3 倍,Claude 需求在企业、开发者和消费者市场飙升
MAJOR
Google 向五角大楼提供分类 AI,加入 OpenAI 和 xAI 行列,协议包含安全过滤器但排除国内监控和无人监督自主武器
Google DeepMind 组建"突击队"追赶 Anthropic,Sergey Brin 发内部备忘录称必须紧急缩小 agentic 执行能力差距
微软与 OpenAI 解除独家协议,一天后 AWS 在 Bedrock 平台推出三款 OpenAI 产品,包括联合开发的 agent 服务
4 月科技裁员近 4 万人,Oracle、Meta、Snap 等公司持续重组,公司优先考虑 AI 投资、自动化和运营效率而非劳动力扩张
DeepSeek V4 发布,Flash 和 Pro 系列在代码基准测试中表现顶级,采用混合注意力架构,上下文窗口达 100 万 token
欧盟 AI 法案谈判破裂,4 月 28 日三方会谈未能达成 Omnibus 协议,8 月 2 日高风险 AI 招聘工具截止日期保持不变
Claude 代码 agent 误删生产数据库,一家初创公司的 AI 编码 agent 通过 Cursor 工具在数秒内自主删除数据库和备份,凸显自主 AI 风险
LLNL 与 Meta 发布 OPoly26 数据集,包含 600 万量子精度聚合物结构模拟,为 AI 材料设计提供开源训练数据
Nvidia 发布 Isaac GR00T 开放模型和 Cosmos 世界模型,加速机器人开发,GTC 上展示从仿真到边缘计算的全栈云端到机器人工作流
精选 AI4Science 突破,涵盖材料发现、自动化实验与科学基础模型
Nature Machine Intelligence 发表 MatterChat 框架,有效整合材料结构数据与大语言模型,实现高精度性质预测并提供可解释推理,加速材料发现。KIT 团队利用 LLM 和概念图预测材料科学研究方向,可提前 2-3 年识别新兴趋势。
Tufts 大学研究人员将神经网络与类人符号推理结合,将机器人 AI 能耗降低最高 100 倍同时提高准确性。该方法发表于 arXiv,为可持续 AI 提供新路径。
Nature Communications 报道采用 NLP 技术筛选单原子催化剂用于钠硫电池,构建二元描述符优化候选材料,Co-N/S 单原子催化剂显著促进硫还原反应,软包电池实现高质量负载。
Nature Communications Materials 团队开发基于 GPT-4 的通用方法微调 LLM,在材料合成提取中实现高精度,构建材料科学优化综合知识图谱,展现跨领域广泛适用性。
Nature 子刊报道铁-氢机器学习原子间势能,大规模分子动力学模拟揭示氢可抑制晶界的 <111>{112} 位错发射,为能源合金设计提供指导。
Energy Material Advances 发表研究,利用理论计算和电化学实验设计 Ni-DHBQ 等π-d共轭配位聚合物用于钠离子电池,Ni-DHBQ 展现最小带隙和最高共轭度,在 0.1 A/g 下容量达 157 mAh/g,500 次循环稳定性优异。
材料科学 × 机器学习:从催化剂发现到晶体结构预测
提出 MatterChat 框架,结合材料结构图数据与大语言模型,通过自举训练策略实现材料性质高精度预测,为材料发现提供可解释推理能力。
利用 LLM 从材料科学摘要构建语义概念图,训练机器学习模型从历史数据预测新兴主题组合,可提前 2-3 年识别研究趋势,为专家提供研究灵感。
采用 NLP 技术筛选钠硫电池单原子催化剂,构建二元描述符优化候选。原子级分散 Co-N/S 催化剂显著促进硫还原,原位 XAS 揭示动态相互作用,软包电池高负载性能优异。
提出 ME-AI 框架,将材料专家直觉转化为可量化描述符,从实验测量数据中提取。在方网化合物拓扑半金属预测中复现专家规则,揭示高价态为关键化学杠杆,模型可跨结构迁移。
结合神经网络与符号推理的神经符号方法,在结构化长时操作任务中超越视觉-语言-动作模型,能耗降低最高 100 倍同时提高准确性,为可持续机器人 AI 提供新方向。
LLNL 与 Meta 合作创建全球最大聚合物原子化学开放数据集 OPoly26,包含 600 万量子精度多样化聚合物结构模拟,显著提升 AI 对聚合物行为建模精度,支持可持续材料设计。
当前主流大模型一览,持续跟踪能力边界
关键基准横向对比,数字不说谎
| 模型 | 机构 | MMLU | MATH | HumanEval | 亮点 |
|---|---|---|---|---|---|
| GPT-5.4 | OpenAI | N/A | N/A | N/A | GDPval 83% 超人类专家,OSWorld-Verified 75% |
| Gemini 3.1 Pro | N/A | N/A | N/A | GPQA Diamond 94.3%,ARC-AGI-2 77.1% | |
| Claude Opus 4.7 | Anthropic | N/A | N/A | N/A | 代码和 agent 工作流领先,提升 20% 速度 |
| Claude Mythos | Anthropic | N/A | N/A | N/A | SWE-bench Verified 93.9%,GPQA 94.6% |
| DeepSeek V4 | DeepSeek | N/A | N/A | N/A | 代码基准顶级,开源模型前列 |
| Grok 4.3 | xAI | N/A | N/A | N/A | 4 专家并行架构,实时 X 数据接入 |
行业领袖在想什么,说了什么
"极其强大的 AI 到来的速度超出预期"
Anthropic 发布博客预测未来两年将出现更重大进展,强调 AI 发展正在加速,进步会随时间累积。Claude 年化营收已超 300 亿美元。
"AI 向文化和经济的扩散阻力超预期"
奥特曼在行业会议上表示对 AI 融入文化和经济速度的失望。OpenAI 预计 2026-2028 年营收每年翻倍,目标是 2026 年 AI 达到"实习研究员"水平。
"几乎不同意 Amodei 关于 AI 的所有观点"
黄仁勋公开质疑 Anthropic CEO 关于 AI 威胁和就业影响的论述,认为 AI 不应只由少数公司控制。Nvidia 在 2025 年 9 月市值首次突破 5 万亿美元。
每天早上推送到你的邮箱,领袖观点 · 大事 · 论文,不错过 AI 前沿。
分享 AI4Science 前沿、科研心得与个人实验笔记。欢迎来聊。
对话 AI 与科学交叉领域的一线研究者。每期一位,一个问题:AI 正在如何改变你的研究?