AI 发现等离子体新物理
Emory 大学研究团队使用定制机器学习在尘埃等离子体(第四态物质)中发现意外的物理规律,该方法可应用于涂料、油墨和活细胞等多组分系统。研究发表于 PNAS。
A daily radar for AI · AI4Science · Materials Discovery
Track frontier model releases, scientific ML breakthroughs, materials discovery, benchmarks, and conference deadlines — updated daily.
从今日资讯与论文中提炼出最値得关注的三项进展
开发了高度可迁移、高效且鲁棒的条件生成框架 PODGen,通过整合通用生成模型和多个属性预测模型,用于搜索拓扑绝缘体的成功率比无约束方法高约 5 倍。
Google 成功阻止黑客组织利用 AI 进行大规模攻击事件,该组织计划使用 AI 工具 OpenClaw 发动零日攻击,但 Google 的主动发现可能阻止了其使用。
Microsoft、Google 和 xAI 同意向美国政府提供 AI 模型早期访问权限,供商务部 CAISI 在公开发布前进行国家安全测试和风险评估。
由 Claude 搜索汇总,覆盖模型发布、政策动态、行业进展
Google 成功阻止黑客组织利用 AI 进行大规模攻击事件,该组织计划使用 AI 工具 OpenClaw 发动零日攻击,但 Google 的主动发现可能阻止了其使用。
BREAKING
Microsoft、Google 和 xAI 同意向美国政府提供 AI 模型早期访问权限,供商务部 CAISI 在公开发布前进行国家安全测试和风险评估。
Anthropic 推出 Project Glasswing 计划,向精选企业(AWS、Apple、Cisco、Google 等)开放 Claude Mythos Preview,该模型能发现零日漏洞,数周测试发现数千个主要操作系统和浏览器漏洞。
OpenAI 发布 GPT-5.5 Instant,成为 ChatGPT 新的默认模型,在 AIME 2025 数学测试中得分 81.2(前代 65.4),能搜索过去对话、文件和 Gmail 提供个性化回答。
OpenAI 和 Anthropic 正探索收购工程服务和咨询公司,OpenAI 计划筹集约 40 亿美元建立部署公司,Anthropic 也筹集约 15 亿美元用于企业 AI 部署。
Nvidia 在 2026 年承诺超过 400 亿美元股权投资,包括对 OpenAI 投资 300 亿美元、Corning 32 亿美元和 IREN 21 亿美元。
四家中国实验室在 12 天内发布开源编码模型:智谱 GLM-5.1、MiniMax M2.7、Moonshot Kimi K2.6 和 DeepSeek V4,达到西方前沿水平但推理成本不到 Claude Opus 4.7 的三分之一。
Alphabet 股价在过去 12 个月上涨 160%,分析师称其因拥有芯片、模型、基础设施和分发渠道的「全栈」能力而成为最佳定位的 AI 公司之一。
Stanford AI Index 2026 报告显示,生成式 AI 在三年内达到 53% 的人口采用率,快于个人电脑或互联网;美国消费者从生成式 AI 工具获得的估计价值达每年 1720 亿美元。
76% 的组织在 2026 年雇佣首席 AI 官(CAIO),而 2025 年仅为 26%,突显企业对专门 AI 领导的战略重视。
精选 AI4Science 突破,涵盖材料发现、自动化实验与科学基础模型
Emory 大学研究团队使用定制机器学习在尘埃等离子体(第四态物质)中发现意外的物理规律,该方法可应用于涂料、油墨和活细胞等多组分系统。研究发表于 PNAS。
ICML 2026 「AI 科学家」研讨会讨论 AI 从工具到合作者再到创始人的转变。Coscientist、A-Lab、FutureHouse Kosmos 等系统已能自主规划实验、驱动机器人甚至撰写论文。
Open Catalyst Project(OC20、OC22)形成表面-催化剂相互作用的大规模数据集,支持 GNN 模型预测真实环境中的反应能量学,包括单原子催化剂和低对称性表面。
Berkeley Lab 的 Materials Project 现服务超 65 万用户,引用超 3.2 万次,自 2022 年 5 月以来用户数增长 2.5 倍。疫情期间其 AI 就绪性使材料研究在实验室限制下得以继续。
MIT 研究指出,2026 年全球数据中心电力消耗预计达 620-1050 TWh,主要归因于生成模型流行。AI 数据中心功率容量已达 29.6 GW,相当于纽约州峰值需求。
材料科学 × 机器学习:从催化剂发现到晶体结构预测
开发了高度可迁移、高效且鲁棒的条件生成框架 PODGen,通过整合通用生成模型和多个属性预测模型,用于搜索拓扑绝缘体的成功率比无约束方法高约 5 倍。
该综述展示了过去几十年材料设计的关键计算进展,突出从传统筛选方法到深度生成模型驱动的逆向生成的范式转变,讨论了材料逆向设计的当前挑战和未来展望。
提出了从概念到商业化构建透明、可扩展和可持续 AI 驱动基础设施的结构化框架,强调开源工具统一数据采集、建模、模拟和部署,民主化访问并促进协作。
IIT Delhi 研究团队开发的专门针对材料科学的语言模型 LLaMat,在关键科学任务上优于主流商业 AI 系统,基于数百万材料论文和数据训练。
ICLR 2026 材料 AI 研讨会聚焦反馈驱动学习在材料科学中的作用,以及跨模态统一材料表示(从结构到性能),探讨融合结构表征、性能测量和性能指标的多模态数据。
提出混合扩散-Transformer 架构用于高效生成金属有机骨架(MOF),在化学空间广阔和属性标记数据稀缺的情况下实现目标性质的材料设计。与 Aspuru-Guzik 和 Jihan Kim 合作。
当前主流大模型一览,持续跟踪能力边界
关键基准横向对比,数字不说谎
| 模型 | 机构 | MMLU | MATH | HumanEval | 亮点 |
|---|---|---|---|---|---|
| Claude Sonnet 4.5 | Anthropic | 93.5 | 89.7 | 97.6 | HumanEval 代码生成领先 |
| GPT-5.5 Instant | OpenAI | 92.8 | 81.2 | 95.1 | AIME 2025 数学测试强 |
| Gemini 3.1 Pro | 94.3 | 88.1 | 94.5 | GPQA Diamond 领先 94.3% | |
| Claude Opus 4.6 | Anthropic | 93.0 | 90.2 | 96.2 | HLE 工具辅助 53.1% 领先 |
| DeepSeek-R1 | DeepSeek | 90.8 | 87.3 | 94.2 | 开源推理模型性价比高 |
| Kimi K2.6 | Moonshot AI | 89.5 | 85.6 | 94.5 | 成本最低的前 10 模型 |
| Grok 4.20 | xAI | 91.2 | 86.4 | 97.0 | 200万token上下文窗口 |
行业领袖在想什么,说了什么
"今年公司算力需求将增长80倍"
Anthropic 宣布与 Blackstone、高盛和 General Atlantic 达成 15 亿美元合资企业,以 Claude 部署到其投资组合公司。同时,Anthropic 的 Mythos 模型因能发现零日漏洞而受到白宫关注。
"前沿模型行为变得奇怪,会提出具体要求"
奥特曼在 Stripe Sessions 上透露 GPT-5.5 能为自己策划派对并提出具体要求。同期,他正在 Musk 诉 OpenAI 案中作证,前 CTO Mira Murati 证词称他曾向不同人说不同的话。
"信任已不相关,AGI 将带来未知后果"
这位传媒大亨在《华尔街日报》活动上表示,虽然他信任奥特曼的诚意,但真正的问题不是信任,而是 AI 创造者自己都无法预知的未知影响。他警告 AGI 接近,必须设立防护栏。
每天早上推送到你的邮箱,领袖观点 · 大事 · 论文,不错过 AI 前沿。
分享 AI4Science 前沿、科研心得与个人实验笔记。欢迎来聊。
对话 AI 与科学交叉领域的一线研究者。每期一位,一个问题:AI 正在如何改变你的研究?