21世纪经济报道记者雷晨

2026年的春节联欢晚会,对字节跳动来说意义特殊。

就在2025年12月29日,字节跳动官宣旗下的火山引擎成为“2026年春晚独家AI云合作伙伴”。火山引擎将利用前沿的多模态大模型和云计算技术,深度参与到春晚的节目、线上互动与直播中。

仅仅一个月后,2026年1月29日,字节跳动CEO梁汝波在公司全员会议上,把新一年的关键词定为“勇攀高峰”。他明确指出,短期内要攀登的这座“高峰”,就是“豆包/Dola助手应用”。这为火山引擎的春晚亮相,给出了企业层面的注脚。

牵手春晚,是一场对外的盛大技术呈现;锚定“豆包”为高峰,则是对内的战略聚焦。梁汝波在会上坦言,尽管豆包增长迅猛,但与全球顶尖同行相比仍存差距。他清醒地认识到,攀登这座高峰的“时间窗口”正在收窄。科技史表明,个人电脑时代的竞争可延续十余年,而移动互联网时代,从iPhone问世到格局初定,仅用了四年左右。这一次,AI技术革命所开启的机遇期,或许同样不会太长。

然而,故事的开端并非一路领先。要理解这场总攻的意义,需将时钟拨回更早的起点。

如何后来居上?

故事的开端并不领先。时间回到2023年初,当全球为GPT-4的发布而震动时,字节跳动内部对大模型还没有统一的方向,资源分散,多个团队各自探索。

转折发生在GPT-4发布后。公司高层迅速行动,成立专项,并启动了名为“豆包”的助手原型开发。最初的豆包藏在抖音搜索里,是一个借助流量尝试的产品。

真正的转变始于2024年。字节跳动进行了公司成立以来最彻底的一次业务重组,将AI业务升级为与抖音、TikTok平级的一级战略部门。这次变革立竿见影。到2024年底,豆包的月活跃用户数已经达到7523万,成为国内最受欢迎的AI原生应用之一。

如果2024年是确立领先地位,那么2025年之后,豆包开始了一场彻底的“破圈”运动。它不再满足于只做一个会聊天的机器人,而是要把自己变成连接现实世界的“智能体”。

近期最直观的一次“破圈”发生在2026年初的上海浦东美术馆,豆包成为官方AI讲解员。它能精准识别高度相似的艺术品,并像专家一样回答观众关于艺术和历史的各种深度问题。观众无需额外花钱或预约,就能获得个性化的观展体验。

但更大胆、也更具争议的“破圈”,是豆包尝试成为你手机的执行人。2025年底,“豆包手机助手”技术预览版发布。它与手机厂商合作的工程样机迅速售罄。这款产品的核心能力在于,它获得了系统级权限,能“看懂”你的手机屏幕,并模拟人的手指去点击操作。

用户只需说一句话,它就能自动帮你完成跨应用比价购物、订票、整理文件等一连串复杂任务。这个功能直接将手动操作所需的数分钟,压缩到了几秒钟。然而,这触碰了现有移动互联网生态最敏感的规则。

AI入口大战

在豆包手机助手这款产品上,字节跳动从一开始就扬长避短,选择与手机厂商“合纵连横”,明确了自己“不做手机,只做生态”的定位。

然而,它的出现却挑战了移动互联网十年来的基本规则:每个应用都是一个独立的、封闭的“王国”。

争议迅速从言论变为实际限制。微信、淘宝、支付宝及多家银行App,都开始对这类自动化操作进行封禁。用户反馈遇到了登录异常提示,甚至账号被强制下线。面对压力,豆包手机助手主动下线了操作这些主流应用的能力。

腾讯董事会主席马化腾近期更是在一次内部会议上评论,这种将屏幕内容上传云端的方式“极其不安全、不负责任”。豆包团队则在微博回应,强调用户授权和隐私保护。

此次“隔空交锋”的本质,是关于未来生态控制权的争夺。豆包的“系统级智能体”路线,试图绕过应用厂商设定的接口来操作一切。这对于那些追求生态闭环的超级应用平台来说,无疑是一种根本性的挑战。

当前,国内一场宏大的AI入口战事正在上演。到2026年初,国内AI应用格局已初步定型,字节豆包、阿里千问、腾讯元宝、百度文心助手等应用形成了四大超级入口。

据QuestMobile数据,截至2024年12月,豆包MAU达7523万,稳居国内AI原生应用首位,AI原生App整体MAU突破1.2亿,同比增长232%。

此外,Quest Mobile发布的《2025下半年AI应用交互革新与生态落地报告》显示,全市场AI原生App中,最新周活跃用户排名前五的依次是豆包、DeepSeek、元宝、蚂蚁阿福、阿里千问。在周活跃用户规模上,通用AI当前的规模领先优势明显,豆包的周活跃规模达到了1.55亿,DeepSeek、元宝分别为8156万、2084万。

在行业人士看来,竞争已经从单纯比较谁的模型回答更聪明,升级到了谁能构建更强大、更开放的生态系统。谁的AI能真正理解用户意图,并调动最丰富的服务来满足它,谁就掌握了定义下一代互联网入口的钥匙。

豆包的生态野望

那么,豆包生态的终极蓝图究竟是什么?梁汝波在近期的内部讲话中给出了方向,也坦承了挑战。他清醒地指出,虽然豆包增长很快,但与全球最顶尖的同行相比仍有差距,而且攀登的时间窗口正在缩短。

为此,字节跳动启动了力度空前的全球人才激励计划,并强调必须建立全球一流的公众信任,高标准保护数据隐私,同时以开放谦逊的态度探索外部合作。

记者注意到,豆包的硬件布局远不止于手机屏幕。行业信息显示,字节跳动正在同时研发多款硬件,为一个“无处不在的豆包”铺路,其中包括AI眼镜AI智能体耳机等产品。

这些硬件的共同核心,就是与豆包模型的深度协同。试想一下,用户可能不再需要频繁拿起手机,只需通过眼镜或耳机下达指令,豆包在云端处理完毕后,直接将结果反馈到你的耳边,实现真正的无缝交互。

从藏在抖音里的一个功能,到独立的战略级产品;从回答问题的聊天机器人,到操作手机、讲解艺术的智能体;从手机App,到眼镜、耳机等新硬件……豆包的演进路径清晰可见:它正试图让搭载自己能力的智能体,成为未来所有智能设备的“标准灵魂”。

2026年除夕夜,火山引擎和豆包大模型将在后台提供支持。这场春晚,对于字节跳动而言也因此有了两层意义,既是一次科技展示,更是它把自己的AI生态正式呈现给全国人民的一次盛会。

中国互联网巨头在AI时代的竞合已进入更关键的阶段。而豆包的发展历程,正是这场宏大角逐中,最具野心的一章。