AI 发现拓扑半金属
Nature Communications 报道了 Materials Expert-AI 框架,通过机器学习从实验数据中提取专家直觉,发现超价性是拓扑半金属的关键预测因子
A daily radar for AI · AI4Science · Materials Discovery
Track frontier model releases, scientific ML breakthroughs, materials discovery, benchmarks, and conference deadlines — updated daily.
从今日资讯与论文中提炼出最値得关注的三项进展
Microsoft 等团队开发 MatterGen 生成模型,可直接生成满足性质约束的稳定无机材料,成功率是以往方法两倍,并可针对化学、力学、电磁性质微调
OpenAI CEO 萨姆·奥特曼出庭作证,反驳马斯克指控,称 Musk 曾要求 90% 股权并提议将 OpenAI 传给子女
Anthropic 一季度营收年化增长 80 倍,CEO 称增长「太疯狂」,与 SpaceX 合作获取 300+ MW 算力
由 Claude 搜索汇总,覆盖模型发布、政策动态、行业进展
OpenAI CEO 萨姆·奥特曼出庭作证,反驳马斯克指控,称 Musk 曾要求 90% 股权并提议将 OpenAI 传给子女
MAJOR
Anthropic 一季度营收年化增长 80 倍,CEO 称增长「太疯狂」,与 SpaceX 合作获取 300+ MW 算力
Anthropic Claude Mythos 模型发现数万软件漏洞,CEO 警告有 6-12 个月窗口期修复,中国 AI 追赶迅速
OpenAI 发布 GPT-5.5 Instant,成为 ChatGPT 新默认模型,减少 50% 幻觉率,并可搜索历史对话和文件
Google 发布 Gemma 4 开源模型,针对高级推理与智能体工作流优化,已有 5 亿次下载量
黄仁勋在卡内基梅隆大学毕业演讲中称,毕业生正站在 AI 革命起点,这一时刻无比完美
中国四家 AI 实验室 12 天内发布开源编码模型,包括 GLM-5.1、MiniMax M2.7、Kimi K2.6 和 DeepSeek V4
Meta 宣布 AI 资本支出达 1150-1350 亿美元,几乎是去年两倍,并推出 Llama 4 小型专有模型
NVIDIA 与 Corning 合作将美国光纤产能提升 10 倍,在北卡和德州建三家新厂,创造 3000+ 就业
澳大利亚 2026 年公有云支出将达 336 亿美元,同比增长 17.9%,AI 工作负载推动需求
精选 AI4Science 突破,涵盖材料发现、自动化实验与科学基础模型
Nature Communications 报道了 Materials Expert-AI 框架,通过机器学习从实验数据中提取专家直觉,发现超价性是拓扑半金属的关键预测因子
Nature 发表 Microsoft 等团队开发的 MatterGen 模型,可生成稳定且多样的无机材料,成功率是以往方法两倍以上,并可针对化学、对称性、力学等性质进行微调
Nature Materials 综述指出,材料设计已从传统筛选方法转向由深度生成模型驱动的逆向生成范式,讨论了当前挑战与未来方向
Nature Machine Intelligence 报道印度理工学院团队开发的 LLaMat 领域语言模型,在 400 万篇材料科学论文上训练,42 项任务中超越 Claude、GPT 和 Gemini
Nature Communications Materials 提出端到端 AI 框架,强调开源工具统一数据获取、建模、仿真和部署,民主化访问并促进可持续材料发现与先进制造
npj Computational Materials 综述 AI、HPC 和机器人自动化如何加速材料发现各阶段,通过提升数据生成、访问和推理能力实现规模化
材料科学 × 机器学习:从催化剂发现到晶体结构预测
Microsoft 等团队开发 MatterGen 生成模型,可直接生成满足性质约束的稳定无机材料,成功率是以往方法两倍,并可针对化学、力学、电磁性质微调
综述材料设计计算方法的范式转变,从传统筛选转向深度生成模型驱动的逆向设计,讨论当前挑战与未来方向
提出透明、可扩展的 AI 驱动基础设施框架,从概念到商业化覆盖材料发现与先进制造,强调开源工具统一数据、建模、仿真和部署以促进协作与可持续性
开发 ME-AI 机器学习框架,从实验数据中捕捉专家直觉为量化描述符,揭示超价性是拓扑半金属的关键预测因子
印度理工学院团队在 400 万篇材料科学论文上持续预训练开发 LLaMat 领域语言模型,42 项任务中超越 Claude、GPT 和 Gemini,展现领域适应 AI 优势
当前主流大模型一览,持续跟踪能力边界
关键基准横向对比,数字不说谎
| 模型 | 机构 | MMLU | MATH | HumanEval | 亮点 |
|---|---|---|---|---|---|
| Claude Mythos Preview | Anthropic | N/A | N/A | N/A | GPQA Diamond 94.6% 领先 |
| GPT-5 | OpenAI | 92.5 | 100.0 | N/A | AIME 2026 满分 |
| Gemini 3.1 Pro | N/A | N/A | N/A | MMLU-Pro 89.8%,200 万 token 上下文 | |
| Claude Opus 4.7 | Anthropic | N/A | N/A | N/A | SWE-bench Verified 80.9% |
| GPT-5.5 Instant | OpenAI | N/A | 81.2 | N/A | AIME 2025: 81.2%,MMMU-Pro: 76% |
| Grok 4.20 | xAI | N/A | N/A | N/A | Mensa Norway IQ 145,并列第一 |
| Kimi K2.6 | Moonshot | N/A | N/A | N/A | GPQA 90.5%,开源权重领先 |
行业领袖在想什么,说了什么
"AGI 不应由任何单个人控制"
在 Musk 诉 OpenAI 庭审中作证,称公司创立初衷就是防止 AGI 由单人掌控,并反驳 Musk 关于「窃取慈善组织」的指控
"我们一季度的增长是80倍"
在开发者大会上披露 Anthropic Q1 营收和使用量年化增长达 80 倍,远超预期的 10 倍增长,Claude Mythos 模型已发现数万软件漏洞
"AI 不会取代你,会用 AI 的人会"
在卡内基梅隆大学毕业典礼演讲中表示,毕业生正站在 AI 革命起点,这是美国再工业化的最佳时机
每天早上推送到你的邮箱,领袖观点 · 大事 · 论文,不错过 AI 前沿。
分享 AI4Science 前沿、科研心得与个人实验笔记。欢迎来聊。
对话 AI 与科学交叉领域的一线研究者。每期一位,一个问题:AI 正在如何改变你的研究?