Skip to content

AI 新闻日报 - 2026年2月8日

本文档收集了2026年2月8日最新的 AI 行业动态、产品发布、研究突破。


1. Waymo联手DeepMind打造世界模型:基于Genie 3,让自动驾驶「脑补」罕见场景

来源: 机器之心
时间: 2026-02-07 19:36
分类: 自动驾驶 / 世界模型

摘要:
Alphabet 旗下的自动驾驶汽车公司 Waymo 推出了最新世界模型 Waymo World Model,其基于 DeepMind 的 Genie 3 构建,在大规模、超真实自动驾驶仿真方面树立了全新的行业标杆。DeepMind CEO、诺奖得主 Demis Hassabis 也转推分享说这个基于 Genie 3 模拟的用例「超酷」。

Waymo World Model 建立在 Google DeepMind 的通用世界模型 Genie 3 之上,能够生成高度逼真且可交互的 3D 环境,并针对自动驾驶的严格需求进行了专业化适配。凭借 Genie 丰富的世界知识,它可以模拟极为罕见的事件——从龙卷风到偶遇大象——这些在现实中几乎无法大规模复现。

Waymo 表示,Waymo Driver 已累计完成近 2 亿英里的完全自动驾驶行驶,成为美国多个主要城市运行体系中的一部分。在真正驶上公共道路之前,这套系统早已在虚拟世界中行驶了数十亿英里,反复演练各种复杂、罕见甚至极端的交通场景。

原文链接: https://www.jiqizhixin.com/articles/2026-02-07-5


2. 人形机器人的真机强化学习!ICLR 2026 通研院提出人形机器人预训练与真机微调新范式

来源: 机器之心
时间: 2026-02-07 19:29
分类: 机器人 / 强化学习 / 世界模型

摘要:
来自北京通用人工智能研究院和西安电子科技大学的研究团队提出的 LIFT 给出了一条更现实的路径:先用离策略(Off-policy)强化学习算法 SAC(Soft Actor-Critic)在仿真中进行大规模预训练,充分利用数据复用带来的样本效率;再在预训练数据之上学习一个物理信息增强(Physics-informed)的世界模型。

到了真实世界,机器人主要执行确定性、更可控的动作来采集数据与微调,把 "试错" 和 "探索" 尽可能放进世界模型里发生,从而在保证安全的前提下,用有限的真机交互下实现更快的微调与提升,绕开部分 sim2real 的硬瓶颈。

作者在两款人形平台 Booster T1 与 Unitree G1 上进行了预训练和微调实验。相比于基线方法,LIFT 展现了显著的优势:在真机上仅用约 80–590 秒的真实数据,就能逐步修正策略的不稳定行为。

论文链接: https://arxiv.org/abs/2601.21363
代码链接: https://github.com/bigai-ai/LIFT-humanoid


3. 苏炜杰获2026「统计学诺奖」考普斯奖,14年来首位华人得主

来源: 机器之心
时间: 2026-02-07 19:20
分类: 学术奖项 / 统计学 / AI基础研究

摘要:
在时隔 14 年之后,有着「统计学诺贝尔奖」之称的考普斯奖(COPSS Presidents' Award),又一次迎来了华人得主。2026 年考普斯奖颁给了「北大校友、现宾夕法尼亚大学副教授苏炜杰」。

奖项委员会给他的评语是,「为大语言模型的多项应用建立了严格的统计基础;在隐私保护数据分析方面取得突破性进展,并成功应用于 2020 年美国人口普查;设计了 AI 顶级会议的同行评审机制,并于 ICML 2026 正式落地;在凸优化领域开展了奠基性研究;以及在深度学习的数学理论与高维统计推断方面作出了广泛而深远的贡献。」

苏炜杰现任教于宾夕法尼亚大学沃顿商学院统计与数据科学系,同时在数学系、计算机系担任兼职,宾大机器学习研究中心联合主任。

参考链接: https://community.amstat.org/copss/awards/presidents


4. 像挖币一样挖激活函数?DeepMind搭建「算力矿场」,暴力搜出下一代ReLU

来源: 机器之心
时间: 2026-02-07 19:17
分类: 深度学习 / 激活函数 / 神经架构搜索

摘要:
谷歌 DeepMind 在一篇刚发布的重磅论文《Finding Generalizable Activation Functions》中展示了他们如何利用 AlphaEvolve 在无限的 Python 函数空间中「挖掘(mining)」出了全新的激活函数。这是一次架构搜索(NAS)的胜利,更是一次方法论的革新。

DeepMind 并没有在庞大的 ImageNet 上直接搜索,而是构建了一个「微型实验室」,利用合成数据专门针对分布外泛化(OOD Generalization)能力进行优化。

结果令人震惊:机器不仅重新发现了 GELU,还挖掘出了一系列带有周期性扰动项的奇异函数,例如 GELUSine 和 GELU-Sinc-Perturbation。这些函数在算法推理任务(如 CLRS-30)上展现出了超越 ReLU 和 GELU 的卓越泛化能力,同时在标准视觉任务上保持了强大的竞争力。

论文地址: https://arxiv.org/abs/2602.05688


5. 全新视角看世界模型:从视频生成迈向通用世界模拟器

来源: 机器之心
时间: 2026-02-07 19:10
分类: 世界模型 / 视频生成 / 综述

摘要:
快手可灵团队与香港科技大学(广州)陈颖聪教授团队联合发表了从全新视角深度剖析视频世界模型的系统综述。本文旨在弥合当代「无状态」视频架构与经典「以状态为中心」的世界模型理论之间的鸿沟,首次提出以「状态构建(State Construction)」与「动态建模(Dynamics Modeling)」为双支柱的全新分类体系。

研究团队指出,世界模型的运作提炼为三个耦合的核心组件:

  • 观察(Observation):环境的原始感官数据
  • 状态(State):对环境的深度理解
  • 动态变化(Dynamics):预判未来的「引擎」

该综述力倡将评估标准从单纯的「视觉保真度」转向「功能性基准」,并前瞻性地指出了两个关键技术前沿,为视频生成演进至鲁棒的通用世界模拟器提供了清晰的路线图。

论文链接: https://arxiv.org/pdf/2601.17067
GitHub链接: https://github.com/hit-perfect/Awesome-Video-World-Models


6. 春节30亿免单火爆登场,千问APP冲到App Store第一名

来源: 机器之心
时间: 2026-02-06 14:29
分类: 产品发布 / AI应用 / 电商

摘要:
2月6日一早,阿里千问App「春节30亿免单」火爆上线,5小时突破500万单,并超越豆包和元宝,火速登顶苹果App Store免费榜第一,排序形成「千元豆」格局。

在社交平台上,网友纷纷晒出自己用千问App下单的「第一杯AI奶茶」,不少奶茶店老板表示,一早醒来订单就爆了,全来自淘宝闪购。

千问APP春节项目组负责人郑嗣寿表示,在春节这个生活消费活动密集的节点,千问希望通过真金白银的投入,培养用户「有事找AI」的习惯,推动AI融入到真实世界的衣食住行之中。千问App突破传统AI Agent只会聊天、娱乐和发红包的局限,接入淘宝闪购、支付宝、淘宝、飞猪、高德等阿里生态场景,成为「能办事」的AI。


7. 如何降低蛋白质合成成本?OpenAI创建的GPT-5驱动自主实验室将成本降低40%

来源: 机器之心 / ScienceAI
时间: 2026-02-06 14:09
分类: AI for Science / 生物科技 / 自动化实验室

摘要:
OpenAI 与 Ginkgo 生物工厂将 GPT-5 连接到云实验室——一个通过软件远程运行的自动化湿实验室,机器人执行实验并返回数据——并利用这种实验室在环路的配置优化了广泛使用的生物过程:无细胞蛋白合成(CFPS)。

经过六轮闭环实验,系统在 580 个自动化板块上测试了超过 36,000 种独特的 CFPS 反应组。在获得计算机、网页浏览器和相关论文访问权限后,GPT-5 经过三轮实验,确立了低成本 CFPS 的新技术水平,实现了蛋白质生产成本降低 40%(试剂成本提升 57%),包括对自主实验室常见反应条件更具稳健性的新型反应组分。

相关链接: https://openai.com/zh-Hans-CN/index/accelerating-biological-research-in-the-wet-lab/


8. 寻找金融领域的ImageNet——首个信贷多模态评测基准背后的产业与学术对话

来源: 机器之心
时间: 2026-02-06 14:01
分类: 金融AI / 评测基准 / 多模态

摘要:
2月5日,围绕「信贷多模态 AI 如何定标准」,奇富科技举办了一场聚焦产业与学术前沿的直播讨论。直播中,奇富科技联合复旦大学、华南理工大学研究人员近期发布的首个面向信贷场景的多模态评测基准 FCMBench-V1.0 成为核心议题。

该评测基准源自真实信贷业务场景,围绕多模态感知、推理与决策等关键环节设计评估任务,并同步开源数据集与评测工具,试图为金融 AI 建立一把可被广泛认可的「尺子」。

复旦大学陈涛教授指出,深度学习真正的分水岭,并不只是算法突破,而是 ImageNet 的出现,让评测尺度第一次实现了数量级跃迁,终结了小数据集时代「各说各话」的局面。「金融 AI 现在正处在类似的阶段。」


9. OpenClaw狂揽16万star,是时候聊聊Agent Tools的AB面了

来源: 机器之心
时间: 2026-02-06 13:09
分类: 开源项目 / Agent框架

摘要:
OpenClaw 项目在 GitHub 上获得了超过 16 万颗星标,引发了 AI 社区对 Agent Tools 的广泛讨论。该项目的成功反映了业界对高质量 AI Agent 工具框架的强烈需求。

(注:新闻内容被截断,详情请查看原文链接)


10. How separating logic and search boosts AI agent scalability

来源: AI News
时间: 2026-02-06 11:32
分类: Agent架构 / 系统设计

摘要:
来自 Asari AI、MIT CSAIL 和 Caltech 的研究人员提出了一种新的编程模型 Probabilistic Angelic Nondeterminism (PAN) 和 Python 实现 ENCOMPASS。这种方法允许开发者编写 Agent 工作流的「快乐路径」,同时将推理时策略(如束搜索或回溯)委托给单独的运行时引擎。

这种关注点分离为减少技术债务同时提高自动化任务性能提供了一条潜在路径。通过将推理策略视为对执行路径的搜索,该框架允许开发者应用不同的算法——如深度优先搜索、束搜索或蒙特卡洛树搜索——而无需更改底层业务逻辑。

相关链接: https://www.artificialintelligence-news.com/news/how-separating-logic-and-search-boosts-ai-agent-scalability/


📊 今日新闻统计

  • 总新闻数: 10 条
  • 研究突破: 5 条
  • 产品发布: 2 条
  • 行业应用: 3 条
  • 开源项目: 1 条
  • 学术奖项: 1 条

🔥 热门标签

#世界模型 #自动驾驶 #强化学习 #统计学奖 #激活函数 #视频生成 #电商AI #生物科技 #金融AI #Agent框架


整理时间: 2026-02-08
数据来源: 机器之心、AI News
整理人: AI News Hub

基于 VitePress 构建