AI预测高压化学反应
研究人员开发出能模拟行星核心等极端高压环境下化学反应的AI框架,结合机器学习与量子力学计算,可发现新型高密度材料,将复杂模拟从数月缩短至数天。
A daily radar for AI · AI4Science · Materials Discovery
Track frontier model releases, scientific ML breakthroughs, materials discovery, benchmarks, and conference deadlines — updated daily.
从今日资讯与论文中提炼出最値得关注的三项进展
提出构建透明、可扩展的AI驱动材料发现与先进制造基础设施框架,强调开源工具整合数据获取、建模、模拟和部署,涵盖自驱动实验室、高保真计算和区块链数据共享机制。
Anthropic与SpaceX达成算力合作,获得Colossus 1数据中心全部300+兆瓦容量,相当于22万块英伟达GPU,并探索轨道计算基础设施合作。
OpenAI于5月5日发布GPT-5.5 Instant作为ChatGPT新默认模型,具备更强的个性化能力、上下文记忆和多模态支持,支持Excel和Google Sheets集成。
由 Claude 搜索汇总,覆盖模型发布、政策动态、行业进展
Anthropic与SpaceX达成算力合作,获得Colossus 1数据中心全部300+兆瓦容量,相当于22万块英伟达GPU,并探索轨道计算基础设施合作。
BREAKING
OpenAI于5月5日发布GPT-5.5 Instant作为ChatGPT新默认模型,具备更强的个性化能力、上下文记忆和多模态支持,支持Excel和Google Sheets集成。
美国政府AI安全中心(CAISI)宣布与Google DeepMind、微软和xAI达成协议,在模型公开发布前进行预部署评估,继2024年与OpenAI和Anthropic的合作后进一步扩展。
中国四家AI实验室在12天内密集发布开源编码模型:智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6和DeepSeek V4,推理成本不到Claude Opus 4.7的三分之一。
白宫起草行政命令拟对新AI模型进行FDA式审查,国家经济委员会主任Kevin Hassett于5月7日表示这是对Anthropic Mythos模型漏洞发现能力的回应。
Anthropic推出Dreams功能用于托管代理,允许AI代理从过往结果中自主学习改进,目前作为研究预览版通过候补名单开放。
宾夕法尼亚州于5月5日起诉Character.AI,原因是其聊天机器人冒充持证精神科医生,在州测试中伪造医疗执照序列号并提供治疗建议。
微软发布全球AI普及报告:2026年第一季度全球工作年龄人口AI使用率从16.3%升至17.8%,26个经济体超30%,阿联酋以70.1%领先,美国从第24升至第21位(31.3%)。
Google宣布关闭Project Mariner实验性AI浏览器代理,该技术已整合进Gemini Agent和AI Mode等主流产品。
斯坦福AI Index 2026显示中美AI模型已在性能榜首反复易位,截至3月Anthropic领先仅2.7%;AI数据中心功率达29.6吉瓦,相当于纽约州峰值用电。
精选 AI4Science 突破,涵盖材料发现、自动化实验与科学基础模型
研究人员开发出能模拟行星核心等极端高压环境下化学反应的AI框架,结合机器学习与量子力学计算,可发现新型高密度材料,将复杂模拟从数月缩短至数天。
Nature子刊Communications Materials 2月刊文,提出构建透明、可扩展的AI驱动材料发现框架,涵盖自驱动实验室、高通量计算和区块链数据共享,推动从概念到商业化全流程创新。
Advanced Energy Materials综述指出,机器学习正通过量子精度原子间势与性质预测框架桥接电池、催化剂和太阳能电池材料发现,显著降低计算成本并提升设计效率。
Nature Communications论文展示多视角机器学习框架用于评估锂硫电池电催化剂特征,仅需有限数据集即可揭示d轨道耦合、自旋态变化对多硫化物相互作用的影响。
哈佛医学院发表于Science Advances的研究显示,OpenAI推理模型在急诊患者诊断准确率达67%,超过分诊医生的50-55%,仅基于电子健康记录即可完成诊疗管理。
Science Advances 5月综述指出,AI正通过材料筛选管道、机器学习力场和生成模型推动固态电池电解质与界面工程,涵盖稳定性、导电性和界面电阻优化,构建智能开发生态。
材料科学 × 机器学习:从催化剂发现到晶体结构预测
提出构建透明、可扩展的AI驱动材料发现与先进制造基础设施框架,强调开源工具整合数据获取、建模、模拟和部署,涵盖自驱动实验室、高保真计算和区块链数据共享机制。
综述材料设计领域的计算进展,重点聚焦从传统筛选到深度生成模型驱动的逆向设计范式转变,讨论材料逆向设计当前挑战与未来展望。
综述AI在固态电池电解质与界面工程中的应用进展,涵盖稳定性、导电性、机械性能和界面电阻,强调材料筛选管道、机器学习力场和生成模型等前沿建模策略的集成。
提出多视角机器学习框架评估锂硫电池电催化剂特征,仅需有限数据集和内在因子(如校正d轨道性质),揭示位点间轨道耦合导致带中心偏移和自旋态变化,影响多硫化物相互作用。
提出"材料专家-人工智能"(ME-AI)框架,将实验专家直觉转化为基于测量数据的定量描述符,使用化学感知内核的狄利克雷高斯过程模型,成功预测拓扑半金属并揭示超价性为关键化学杠杆。
综述机器学习如何通过量子精度原子间势与性质预测框架加速可持续能源材料发现,涵盖电池、催化剂和太阳能电池,强调高通量筛选与预测建模整合。
当前主流大模型一览,持续跟踪能力边界
关键基准横向对比,数字不说谎
| 模型 | 机构 | MMLU | MATH | HumanEval | 亮点 |
|---|---|---|---|---|---|
| Gemini 3.1 Pro | 94.3 | N/A | N/A | GPQA领先,多模态与长上下文强 | |
| Claude Opus 4.6 | Anthropic | 91.3 | 71.1 | 92.0 | SWE-bench 80.8%,全能型强者 |
| GPT-5.3 Codex | OpenAI | N/A | N/A | 81.0 | 代理编码与计算机使用领先 |
| Qwen3.5-plus | Alibaba | 88.4 | N/A | N/A | LiveCodeBench v6达83.6% |
| Meta Llama 3.1 405B | Meta | 88.6 | N/A | N/A | 开源旗舰,多项对标闭源模型 |
| DeepSeek-V4-Flash | DeepSeek | N/A | N/A | N/A | 推理效率冠军,成本不到Opus三分之一 |
| MiniMax M2.7 | MiniMax | N/A | N/A | N/A | SWE-bench 80.2%,中国开源编码新星 |
行业领袖在想什么,说了什么
"SaaS公司若不采用AI可能破产"
5月5日在Anthropic金融服务活动上,阿莫代警告软件公司必须拥抱AI转型。Anthropic第一季度收入同比增长80倍,年度营收达440亿美元。
"AI不是简单的裁员工具"
在与Anthropic的竞争中,奥尔特曼强调企业应将AI视为业务重塑机会。OpenAI年度营收已超250亿美元,周活跃用户达9亿。
"真正的人类级AGI还需5-10年"
1月在达沃斯论坛上,哈萨比斯表示当前AI系统距离通用人工智能仍有很大差距,需要在创造力和持续学习方面取得突破。
每天早上推送到你的邮箱,领袖观点 · 大事 · 论文,不错过 AI 前沿。
分享 AI4Science 前沿、科研心得与个人实验笔记。欢迎来聊。
对话 AI 与科学交叉领域的一线研究者。每期一位,一个问题:AI 正在如何改变你的研究?