AI能耗降低100倍
Tufts大学研究人员将神经网络与符号推理结合,使机器人AI系统能耗降低100倍的同时提高准确性,将于5月在ICRA维也纳会议展示
A daily radar for AI · AI4Science · Materials Discovery
Track frontier model releases, scientific ML breakthroughs, materials discovery, benchmarks, and conference deadlines — updated daily.
从今日资讯与论文中提炼出最値得关注的三项进展
中国科协宣布停止资助学者参加NeurIPS 2026,并不再将该会议论文认定为代表性成果,因该会议发布制裁条款
提出钠离子电池形成协议优化框架,使用多目标批量贝叶斯优化在FINALES与Kadi4Mat生态系统间实现互操作,通过主动学习高效探索参数空间,在形成时间和寿命性能间寻找帕累托前沿
五角大楼5月1日授予7家公司机密网络AI合同,包括OpenAI、Google、Microsoft、AWS、NVIDIA、SpaceX和Reflection AI,Anthropic因拒绝无限制使用条款被排除
由 Claude 搜索汇总,覆盖模型发布、政策动态、行业进展
五角大楼5月1日授予7家公司机密网络AI合同,包括OpenAI、Google、Microsoft、AWS、NVIDIA、SpaceX和Reflection AI,Anthropic因拒绝无限制使用条款被排除
Anthropic发布10个金融领域预配置AI代理,旨在自动化投资银行、资产管理和保险公司的典型任务
OpenAI年度营收突破250亿美元,据报道正在准备最早于2026年底IPO,Anthropic年营收接近190亿美元
Google发布Gemini 3.1 Ultra,配备200万token上下文窗口,原生支持文本、图像、音频、视频的跨模态推理
四家中国实验室在12天内发布开源权重编程模型:智谱GLM-5.1、MiniMax M2.7、Moonshot Kimi K2.6和DeepSeek V4,成本仅为Claude Opus 4.7的三分之一
NVIDIA在GTC 2026发布新开源模型家族,包括Nemotron 3语音/多模态RAG、Isaac GR00T机器人模型和Cosmos物理AI平台
Snap CEO宣布裁员约1000人并关闭300个开放职位,理由是AI进步使小团队也能达到相同产出
中国科协宣布停止资助学者参加NeurIPS 2026,并不再将该会议论文认定为代表性成果,因该会议发布制裁条款
Stanford HAI发布2026 AI Index报告:生成式AI在三年内达到53%人口采用率,超过PC和互联网普及速度;美中模型性能差距几乎消失
精选 AI4Science 突破,涵盖材料发现、自动化实验与科学基础模型
Tufts大学研究人员将神经网络与符号推理结合,使机器人AI系统能耗降低100倍的同时提高准确性,将于5月在ICRA维也纳会议展示
Google DeepMind的Genie 3、World Labs的Marble商业世界模型发布,2026年被认为是可靠世界模型和持续学习原型的突破之年,用于机器人和代理训练
研究人员开发AI框架模拟行星核心等极端高压条件下的化学反应,结合机器学习与量子力学计算,发现高密度新材料,模拟时间从数月缩短至数天
宾夕法尼亚大学提出Mollifier Layers技术,将经典数学平滑函数集成到神经网络中解决逆偏微分方程,应用于基因组学、材料科学和气候建模,将于NeurIPS 2026展示
AlphaFold帮助研究人员理解疟疾相关关键蛋白的全长结构,标志研究转折点,推动传播阻断疫苗研发以对抗疟疾
研究人员使用AlphaFold预测结构突破可能帮助解决塑料污染问题,加速降解酶和相关蛋白的发现
材料科学 × 机器学习:从催化剂发现到晶体结构预测
提出钠离子电池形成协议优化框架,使用多目标批量贝叶斯优化在FINALES与Kadi4Mat生态系统间实现互操作,通过主动学习高效探索参数空间,在形成时间和寿命性能间寻找帕累托前沿
综述大型AI模型如何重塑催化剂发现范式,整合通用机器学习原子间势(MLIPs)和大语言模型(LLMs)与催化数据库,实现大规模模拟、高效数据获取和自主研究,推动催化剂发现进入持续加速的新时代
提出构建透明、可扩展、可持续AI驱动基础设施的结构化框架,统一数据采集、建模、仿真和部署的开源工具,包括自驱动实验室、区块链数据共享机制和供应链可追溯性,推动材料发现民主化
综述AI在电催化剂发现中的关键作用,聚焦数据、描述符和机器学习模型,讨论AI方法在加速DFT计算、探索反应机理、设计电催化剂和预测性能方面的应用,显著降低传统试错实验的时间和成本
全面综述机器学习和领域自适应在电催化剂材料泛化中的应用,剖析特征对齐、对抗性DA、迁移学习、基于实例和物理引导的DA策略,强调如何跨材料家族和实验条件转移知识、弥合模拟到实验的差距
开发PODGen高度可迁移的条件生成框架,整合通用生成模型与多属性预测模型,用于高通量晶体条件生成搜索拓扑绝缘体,生成TI的成功率约为无约束方法的5倍
当前主流大模型一览,持续跟踪能力边界
关键基准横向对比,数字不说谎
| 模型 | 机构 | MMLU | MATH | HumanEval | 亮点 |
|---|---|---|---|---|---|
| Gemini 3.1 Pro | N/A | N/A | N/A | GPQA-Diamond 94.3%领先,多模态推理强 | |
| Claude Opus 4.7 | Anthropic | N/A | N/A | 93.7 | GPQA 91.3%,写作和长上下文顶级 |
| GPT-5.4 | OpenAI | N/A | N/A | N/A | SWE-bench 74.9%,ARC-AGI-2 标准73.3% |
| Grok 4.3 | xAI | N/A | N/A | N/A | SWE-bench 75%领先,实时信息整合 |
| Qwen 3.5-plus | Alibaba | N/A | N/A | N/A | GPQA 88.4%,开源模型顶级表现 |
| Llama 4 Maverick | Meta | N/A | N/A | N/A | 开源中等任务优秀,广泛部署 |
| DeepSeek R1 | DeepSeek | N/A | N/A | N/A | 2025年2月曾匹配顶级美国模型 |
行业领袖在想什么,说了什么
"AI模型一两年内将达到诺贝尔级科研水平"
在达沃斯论坛上,Amodei预测AI将在一年内替代所有软件开发者工作,并在两年内在多个领域达到诺贝尔级科学研究能力。此后因五角大楼合同问题与OpenAI产生公开争执。
"政府不当权力使用威胁整个AI行业"
与30余位OpenAI和Google员工联署法律声明支持Anthropic诉讼,警告五角大楼将Anthropic列为供应链风险将损害美国AI产业竞争力。
"当前AI系统距离AGI还很远"
在达沃斯上表示今天的AI系统远未达到人类级通用智能,真正的AGI还需5到10年。与Amodei的乐观预测形成鲜明对比,强调需要在持续学习、世界模型等方面取得突破。
每天早上推送到你的邮箱,领袖观点 · 大事 · 论文,不错过 AI 前沿。
分享 AI4Science 前沿、科研心得与个人实验笔记。欢迎来聊。
对话 AI 与科学交叉领域的一线研究者。每期一位,一个问题:AI 正在如何改变你的研究?