AI 发现等离子体新物理
埃默里大学团队结合专门设计的神经网络和粉尘等离子体(第四态物质)的3D 粒子追踪,揭示了粒子相互作用的隐藏模式,展示 AI 在基础物理发现中的潜力。
A daily radar for AI · AI4Science · Materials Discovery
Track frontier model releases, scientific ML breakthroughs, materials discovery, benchmarks, and conference deadlines — updated daily.
从今日资讯与论文中提炼出最値得关注的三项进展
利用大语言模型从材料科学摘要构建语义概念图,训练机器学习模型从历史数据预测新兴主题组合,可提前2-3年识别研究趋势,为材料科学家提供研究灵感。
五角大楼与 OpenAI、Google、微软、英伟达、亚马逊等七家科技巨头签署协议,在机密网络部署 AI 工具,Anthropic 因安全护栏争议被列入供应链风险名单,但白宫已重启谈判。
Sony AI 发布 Ace 乒乓球机器人,在《Nature》封面论文中展示首个击败精英及职业选手的自主物理 AI 系统,标志着 AI 在高速物理交互领域的里程碑。
由 Claude 搜索汇总,覆盖模型发布、政策动态、行业进展
五角大楼与 OpenAI、Google、微软、英伟达、亚马逊等七家科技巨头签署协议,在机密网络部署 AI 工具,Anthropic 因安全护栏争议被列入供应链风险名单,但白宫已重启谈判。
OpenAI 发布 GPT-5.5(4月23日),仅6周后跟进 GPT-5.4,部署更严格的网络安全分类器,模型在代码生成、计算机使用和科研推理任务上表现领先。
Google 发布 Gemini 3.1 Ultra,支持200万 token 原生多模态上下文窗口(文本、图像、音频、视频),并推出 Gemini 3.1 Flash-Lite 以2.5倍速度和45%更快输出降低成本至每百万 token 0.25美元。
华为 AI 芯片营收预计2026年达到120亿美元,同比增长60%,其 Ascend 950PR 订单激增,填补英伟达在中国市场的空白。
Sony AI 发布 Ace 乒乓球机器人,在《Nature》封面论文中展示首个击败精英及职业选手的自主物理 AI 系统,标志着 AI 在高速物理交互领域的里程碑。
Anthropic 推出 Project Glasswing,联合主要科技公司和网络安全厂商建立联盟,保护关键软件安全,同时发布 Claude Opus 4.7 和内部测试的 Mythos 网络安全模型。
Google 在 ICLR 2026 发布 TurboQuant 算法,通过 PolarQuant 和 Quantized Johnson-Lindenstrauss 压缩方法,将 KV 缓存内存开销降低6倍,显著提升大模型推理效率。
Novo Nordisk 与 OpenAI 达成战略合作,计划在2026年底前将 AI 全面整合到药物发现、临床试验、制造、供应链和商业运营,加速肥胖和糖尿病治疗药物开发。
Meta 推出 Muse Spark,首个由新成立的超级智能实验室(负责人为前 Scale AI CEO 王亚历山大)开发的旗舰大模型,偏离过去的开源 Llama 策略,在多模态感知和推理任务上达到竞争性能且计算成本更低。
阿里巴巴 Happy Horse 1.0 视频生成模型在 Artificial Analysis Video Arena 匿名测试中以1389 Elo 分登顶榜首,150亿参数规模成为 AI 视频历史最高分,中国实验室主导视频生成赛道。
精选 AI4Science 突破,涵盖材料发现、自动化实验与科学基础模型
埃默里大学团队结合专门设计的神经网络和粉尘等离子体(第四态物质)的3D 粒子追踪,揭示了粒子相互作用的隐藏模式,展示 AI 在基础物理发现中的潜力。
塔夫茨大学研究团队在 arXiv 发表论文,提出结合神经网络与符号推理的混合架构,在机器人结构化长期操作任务中将能耗降低至100倍,同时提升准确性。
Google 和量子计算初创公司 Oratomic 的论文显示,AI 辅助算法开发加速了能够破解互联网加密的量子计算机的到来时间,Cloudflare 已将量子防护截止日期提前至2029年。
2026年被视为可靠世界模型和持续学习原型的突破年,Google DeepMind 的 Genie 3、World Labs 的 Marble 等系统在实时物理模拟和具身 AI 训练中取得进展。
卡尔斯鲁厄理工学院团队在《Nature Machine Intelligence》发表研究,利用大语言模型和概念图谱系统分析材料科学论文,可提前2-3年预测新兴研究方向。
丹麦制药巨头 Novo Nordisk 与 OpenAI 合作,将 AI 整合到从药物发现、临床试验到制造和供应链的全业务流程,目标是在与礼来的竞争中加速肥胖和糖尿病新疗法开发。
材料科学 × 机器学习:从催化剂发现到晶体结构预测
利用大语言模型从材料科学摘要构建语义概念图,训练机器学习模型从历史数据预测新兴主题组合,可提前2-3年识别研究趋势,为材料科学家提供研究灵感。
提出构建透明、可扩展、可持续的 AI 驱动基础设施框架,从概念到商业化贯穿材料发现和先进制造全流程,强调开源工具统一数据获取、建模、仿真和部署以实现民主化访问。
综述过去几十年材料设计中的关键计算进展,突出从传统筛选方法到由深度生成模型驱动的逆向生成的范式转变,讨论材料逆向设计的当前挑战和未来前景。
东北大学团队在特邀综述中强调大型 AI 模型(通用机器学习原子间势和大语言模型)如何重新定义催化剂发现,通过整合数据库、预测性能和自我改进循环,将发现周期从年缩短至周。
全面综述反应性机器学习原子间势(MLIPs)在化学和材料科学中的应用,包括等变图神经网络(如 Allegro、PaiNN、MACE)在催化、表面科学和凝聚相化学中的最新成功案例。
西班牙加泰罗尼亚化学研究所团队通过结合编程和机器学习,实现异相催化模拟速度的显著提升,用于二氧化碳转化为燃料的反应,显著降低资源密集型过程的能源消耗。
当前主流大模型一览,持续跟踪能力边界
关键基准横向对比,数字不说谎
| 模型 | 机构 | MMLU | MATH | HumanEval | 亮点 |
|---|---|---|---|---|---|
| GPT-5.4 | OpenAI | 92.0 | N/A | 94.5 | MMLU 和 LMArena 领先,通用推理最强 |
| Claude Opus 4.6 | Anthropic | 91.0 | N/A | 95.2 | GPQA Diamond 68.4%、SWE-bench 80.8% 领先 |
| Gemini 3.1 Pro | 90.0 | N/A | 93.0 | GPQA Diamond 94.3% 最高,科学推理强 | |
| DeepSeek V4 | DeepSeek | 89.0 | N/A | 94.8 | SWE-bench 81.0%、LiveCodeBench 73.1% 领先 |
| Claude Sonnet 3.5 | Anthropic | N/A | N/A | 93.7 | HumanEval 第三,开发者满意度高 |
行业领袖在想什么,说了什么
"AGI 是营销术语,下一里程碑是数据中心里的天才国度"
阿莫代在2025年1月接受采访时表示,AGI(通用人工智能)更像是一个营销术语,真正的里程碑将是在数据中心内实现"一国天才"级别的智能系统。
"当公司因不喜欢执政者而抛弃民主规范对社会有害"
在与 Anthropic 关于军事合同的争议中,奥特曼间接批评竞争对手,认为企业不应因政治立场放弃与民主政府合作。OpenAI 营收已超过250亿美元年化规模。
"算法突破与持续扩展双管齐下才能达到 AGI"
哈萨比斯在2026年初的播客访谈中强调,通往 AGI 的路径需要在持续模型规模扩展的同时,在持续学习、世界模型、记忆架构等领域实现算法突破。
每天早上推送到你的邮箱,领袖观点 · 大事 · 论文,不错过 AI 前沿。
分享 AI4Science 前沿、科研心得与个人实验笔记。欢迎来聊。
对话 AI 与科学交叉领域的一线研究者。每期一位,一个问题:AI 正在如何改变你的研究?