AI语言模型指导化学合成
新AI系统Synthegy让化学家用自然语言指导合成与反应规划,强大算法自动生成合成路线并优化参数,大幅缩短复杂分子设计周期。
A daily radar for AI · AI4Science · Materials Discovery
Track frontier model releases, scientific ML breakthroughs, materials discovery, benchmarks, and conference deadlines — updated daily.
从今日资讯与论文中提炼出最値得关注的三项进展
提出从概念到商业化的AI驱动材料发现框架,强调开源工具统一数据采集、建模、仿真与部署,整合自驱动实验室与区块链机制实现安全数据共享。
Anthropic的Claude Mythos模型因卓越网络安全能力引发争议,能自主发现并利用零日漏洞,仅限12家合作机构使用
Anthropic推出金融行业10个预配置AI代理,并发布Claude Opus 4.7及完整Microsoft 365集成,年营收达300亿美元超越OpenAI
由 Claude 搜索汇总,覆盖模型发布、政策动态、行业进展
Anthropic推出金融行业10个预配置AI代理,并发布Claude Opus 4.7及完整Microsoft 365集成,年营收达300亿美元超越OpenAI
美国商务部宣布与Google DeepMind、Microsoft、xAI达成协议,允许政府在模型公开前进行评估,强化AI安全审查
Anthropic的Claude Mythos模型因卓越网络安全能力引发争议,能自主发现并利用零日漏洞,仅限12家合作机构使用
BREAKING
OpenAI GPT-5.5于4月23日发布,仅6周后推出GPT-5.4,专注自主编程与计算机使用,在OSWorld-V基准达75%超越人类基线
美国参议员Sanders和AOC提出AI数据中心暂停法案,要求在制定能源与劳工标准前冻结新建大型AI数据中心
中国开源编程模型集中爆发:DeepSeek-V4、GLM-5.1、Kimi K2.6在12天内发布,推理成本不到Claude Opus 4.7的三分之一
Google发布TurboQuant算法(ICLR 2026),通过KV缓存压缩将大模型内存开销降低100倍,推动效率优先AI开发
哈佛研究显示OpenAI o1模型急诊诊断准确率67%超越分诊医生的50-55%,AI医疗应用进入临床部署阶段
Novo Nordisk与OpenAI达成战略合作,计划2026年底前将AI全面整合至药物研发、临床试验、制造及供应链
五角大楼与SpaceX、OpenAI、Google等8家公司达成协议在机密网络部署AI工具,Anthropic因安全条款分歧被排除
精选 AI4Science 突破,涵盖材料发现、自动化实验与科学基础模型
新AI系统Synthegy让化学家用自然语言指导合成与反应规划,强大算法自动生成合成路线并优化参数,大幅缩短复杂分子设计周期。
DNA折叠技术结合传统机器人学理念,开发可编程纳米级DNA机器人,能在体内递送药物、捕获病毒并构建分子级设备。
新型番茄采摘机器人通过AI预测每个番茄的采摘难度而非仅识别成熟度,据此调整策略,显著提高农业自动化效率。
模仿人脑的神经形态计算机现可求解复杂物理模拟背后的方程,这项工作曾被认为只有高耗能超算才能完成,能耗降低显著。
密歇根大学开发的AI系统可在数秒内解读脑部MRI扫描,准确识别多种紧急情况,大幅加速诊断流程。
NVIDIA在国家机器人周发布Isaac GR00T开放模型,使机器人能理解自然语言指令并执行复杂多步任务,加速物理AI部署。
材料科学 × 机器学习:从催化剂发现到晶体结构预测
提出从概念到商业化的AI驱动材料发现框架,强调开源工具统一数据采集、建模、仿真与部署,整合自驱动实验室与区块链机制实现安全数据共享。
利用大语言模型和机器学习系统分析材料科学文献,通过概念图映射关系预测2-3年内的新兴研究趋势,为材料发现提供前瞻指导。
基于数百万材料论文训练的领域专用语言模型家族,在关键科学任务上超越GPT-4o、Gemini和Claude等通用LLM,提供更高效的材料AI助手。
提出ME-AI框架,从实验数据中提取量化描述符捕捉专家直觉,揭示超价态作为拓扑半金属关键预测因子,弥合计算数据库与实验结果差距。
综述AI在材料科学的变革性影响,涵盖化学信息学、成像、药物发现与增材制造进展,重点介绍ChatMOF、MatKG、MatterGen等新兴AI工具。
宾夕法尼亚大学提出Mollifier层技术,将经典平滑函数集成入神经网络求解逆向偏微分方程,应用于基因组学、材料科学、气候建模与染色质生物学。
当前主流大模型一览,持续跟踪能力边界
关键基准横向对比,数字不说谎
| 模型 | 机构 | MMLU | MATH | HumanEval | 亮点 |
|---|---|---|---|---|---|
| Gemini 3.1 Pro | 94.3 | N/A | N/A | GPQA-Diamond领跑94.3%,多模态推理顶尖 | |
| Claude Opus 4.6 | Anthropic | 91.3 | N/A | 93.7 | HLE工具辅助53.1%,企业定位14/15分 |
| GPT-5.3 Codex | OpenAI | N/A | N/A | N/A | GPQA 81%,编程与推理均衡 |
| Claude 3.5 Sonnet | Anthropic | N/A | N/A | 93.7 | HumanEval 93.7%,开发者首选 |
| Qwen3.5-plus | Alibaba | 88.4 | N/A | N/A | GPQA 88.4%,中文多模态强 |
| DeepSeek-R1 | DeepSeek | N/A | N/A | N/A | 2025年2月曾匹敌美国顶级模型 |
| Kimi K2 0905 | Moonshot AI | N/A | N/A | 94.5 | HumanEval 94.5%,编程任务领先 |
行业领袖在想什么,说了什么
"我担心AI自主行为与被滥用的潜力"
在2月印度AI峰会上警告AI系统自主行为、政府滥用及经济替代风险。Anthropic与五角大楼因安全条款争议被列为供应链风险。
"中心化可能导致毁灭,民主化是唯一安全道路"
在印度AI峰会上强调超级智能治理需要类似IAEA的国际机构。OpenAI宣布年营收超250亿美元,正筹备IPO。
"不能让数字鸿沟变成AI鸿沟"
强调公平获取AI技术的重要性,呼吁投资算力基础设施和连接性。Google发布Gemini 3.1 Ultra,支持200万token多模态上下文。
每天早上推送到你的邮箱,领袖观点 · 大事 · 论文,不错过 AI 前沿。
分享 AI4Science 前沿、科研心得与个人实验笔记。欢迎来聊。
对话 AI 与科学交叉领域的一线研究者。每期一位,一个问题:AI 正在如何改变你的研究?