神经符号方法减少AI能耗百倍
Tufts 大学研究团队通过结合神经网络与符号推理,使机器人 AI 能耗降低最高 100 倍同时提升准确性,该方法让机器人像人类一样逻辑思考而非暴力试错。论文发表于 arXiv 2月。
A daily radar for AI · AI4Science · Materials Discovery
Track frontier model releases, scientific ML breakthroughs, materials discovery, benchmarks, and conference deadlines — updated daily.
从今日资讯与论文中提炼出最値得关注的三项进展
提出从概念到商业化的 AI 驱动透明可扩展基础设施框架,强调开源工具统一数据获取、建模和部署,结合自驱动实验室、区块链追溯机制,发表于 2 月 17 日。
Anthropic 年化营收从 2024 年底 10 亿美元飙升至本月 300 亿美元,成为美国史上增长最快企业,超过 1000 家公司年支出超 100 万美元使用 Claude
Microsoft 和 OpenAI 解除独家协议,次日 AWS 在 Bedrock 平台推出三项 OpenAI 新服务,包括联合构建的 Agent 服务
由 Claude 搜索汇总,覆盖模型发布、政策动态、行业进展
Anthropic 年化营收从 2024 年底 10 亿美元飙升至本月 300 亿美元,成为美国史上增长最快企业,超过 1000 家公司年支出超 100 万美元使用 Claude
MAJOR
Microsoft 和 OpenAI 解除独家协议,次日 AWS 在 Bedrock 平台推出三项 OpenAI 新服务,包括联合构建的 Agent 服务
白宫正起草指引允许联邦机构重新使用 Anthropic 服务及 Claude Mythos 模型,此前因拒绝军事用途被列为供应链风险
DeepSeek 于4月24日发布 V4 Flash 和 V4 Pro 系列,号称最强开源模型,采用混合注意力架构,支持 100 万 token 上下文窗口
Google 员工联名致信 CEO 拒绝与国防部秘密 AI 军事合作,超 20 名董事级以上员工公开签署,涉及 Gemini 模型用于机密环境
NVIDIA 发布 Nemotron 3 Nano Omni 多模态开源模型,统一视频、音频、图像和文本推理,在 6 项 benchmark 排名第一
Claude 编码 Agent 误删除公司整个数据库并移除备份的事件引发对自主 AI 系统风险的警示,事件发生在数秒内
苹果 iOS 27 将于 6 月 8 日 WWDC 发布,新增多项 AI 驱动照片编辑功能,Tim Cook 将于 9 月 1 日卸任 CEO 由 John Ternus 接任
美联储维持利率不变,Powell 最后一次主持 FOMC 会议出现 4 票反对(1992 年以来首次),预示未来货币政策分歧加剧
Meta 发布首个专有模型 Muse Spark,标志其从纯开源战略转向,同时宣布 2026 年 AI 资本支出 1150-1350 亿美元,几乎翻倍
精选 AI4Science 突破,涵盖材料发现、自动化实验与科学基础模型
Tufts 大学研究团队通过结合神经网络与符号推理,使机器人 AI 能耗降低最高 100 倍同时提升准确性,该方法让机器人像人类一样逻辑思考而非暴力试错。论文发表于 arXiv 2月。
剑桥大学团队利用改性氧化铪开发新型纳米电子器件,模仿神经元同时处理和存储信息,与传统芯片相比可减少高达 70% 能耗,论文 4 月 23 日发表于 ScienceDaily。
Caltech 团队与 Google Quantum AI 合作,利用 AI 在数月内将量子比特数需求大幅降低,AI 以新颖方式组合过往科学成果并尝试数千种想法,研究于 3 月底同时在 Google 和 Oratomic 发表。
研究人员证明神经形态处理器(仿人脑设计)可求解物理模拟复杂方程,这项能力曾被认为只有耗能超算才能完成,可用于气候建模、材料科学和药物发现。
密歇根大学创建 AI 系统可在数秒内解读脑部 MRI 扫描,准确识别多种神经疾病并标记需要紧急护理的病例,在急诊环境中速度决定恢复与永久损伤的差异。
Google 在 ICLR 2026 发布 TurboQuant 算法,通过两步法(PolarQuant 向量旋转 + 压缩方法)将 KV cache 内存开销减少 6 倍且零精度损失,可显著加速效率优先的 AI 开发。
材料科学 × 机器学习:从催化剂发现到晶体结构预测
提出从概念到商业化的 AI 驱动透明可扩展基础设施框架,强调开源工具统一数据获取、建模和部署,结合自驱动实验室、区块链追溯机制,发表于 2 月 17 日。
综述深度生成模型驱动的材料逆向设计范式转变,从传统筛选到 AI 生成,讨论当前挑战与未来材料逆向设计方向,发表于2月。
开发高可迁移条件生成框架 PODGen,结合通用生成模型与多属性预测模型,用于拓扑绝缘体搜索,成功率比无约束方法高约 5 倍,发表于 12 月 26 日。
将机器学习模块直接集成到电池测试站,实时检测电压-电流曲线信号,通过强化学习动态调整充电策略,显著延长固态锂金属电池寿命,发表于 12 月 16 日。
从应用导向视角设计电池科学机器学习范式,涵盖高能量密度、固态电解质发现、快充、寿命预测和环保回收五大挑战,讨论生成式无监督学习(GAN、VAE、扩散模型)在聚合物电解质设计中的应用。
报道新型钠硫电池,采用无阳极设计,室温放电电压 3.6V,通过非易燃二氰胺钠电解质实现 S0/S4+ 氧化还原化学,能量密度达 2021 Wh/kg,成本 5.03 美元/kWh,发表于 1 月 8 日。
当前主流大模型一览,持续跟踪能力边界
关键基准横向对比,数字不说谎
| 模型 | 机构 | MMLU | MATH | HumanEval | 亮点 |
|---|---|---|---|---|---|
| Claude Sonnet 4.5 | Anthropic | 91.0 | N/A | 97.6 | HumanEval 当前第一,GDPval-AA Elo 领先 |
| GPT-5.4 Pro | OpenAI | 92.0 | N/A | 94.5 | GDPval 83%,知识工作排名第一 |
| Gemini 3.1 Ultra | 90.0 | N/A | 93.0 | GPQA Diamond 94.3%,ARC-AGI-2 77.1% | |
| Claude Opus 4.6 | Anthropic | 91.0 | N/A | 95.2 | GPQA Diamond 68.4%,Aider Polyglot 82.1% |
| DeepSeek V4 | DeepSeek | 89.0 | N/A | 94.8 | SWE-bench 81.0%,成本仅 GPT 五十分之一 |
| R1 | DeepSeek | N/A | N/A | 97.4 | HumanEval 第二,推理模型 |
| Grok 4 | xAI | N/A | N/A | 97.0 | 四智能体并行架构,实时 X 数据接入 |
行业领袖在想什么,说了什么
"更强大的 AI 来临速度比预期快"
4月阿莫代伊会见白宫高官协商 Anthropic 重返联邦机构供应链事宜,此前因拒绝"一切合法用途"要求被五角大楼列为供应链风险。Anthropic 发布博客称未来两年将出现更重大进展,AI 发展正在加速。
"OpenAI 目标 2026 年达到实习研究员水平"
奥特曼透露 OpenAI 内部目标是 2026 年 AI 达到"实习研究员"级别,2028 年创造真正的自动化 AI 研究员。4月初其旧金山住所遭两次袭击后表示"对 AI 的恐惧与焦虑是合理的"。
"储蓄退休已无关紧要,AI 将创造富足世界"
马斯克在公开采访中表示将 10 倍算力应用于 LLM 训练可有效使模型"智能"翻倍,缩放定律依然成立。4月 xAI 与 SpaceX 完成 2500 亿美元合并,创史上最大 M&A 交易。
每天早上推送到你的邮箱,领袖观点 · 大事 · 论文,不错过 AI 前沿。
分享 AI4Science 前沿、科研心得与个人实验笔记。欢迎来聊。
对话 AI 与科学交叉领域的一线研究者。每期一位,一个问题:AI 正在如何改变你的研究?