字节跳动首次公布AGI目标,五大方向布局长期研究
2025-01-25 22:10:06
  • 0
  • 0
  • 0

近日,字节跳动正式宣布启动代号为“Seed Edge”的 AGI 长期研究项目,标志着这家互联网公司在通用人工智能领域的探索进入了新阶段。据称,Seed Edge 这一命名中,Seed 代表豆包大模型团队,Edge 则象征着对 AGI 前沿的探索。

“Seed Edge”并非字节跳动在 AI 领域的首次冲锋,却是其迄今为止最明确的长周期战略表达,从 2 年前的“ChatGPT 时刻”开始,业界都在密切关注字节跳动的一举一动。

Seed Edge 项目初步确定了五大研究方向:

第一,探索推理能力的边界,聚焦于通过大规模强化学习等技术推动智能边界的提升;

第二,探索感知能力的边界,致力于突破智能与交互的融合,探索世界模型的建模方式;

第三,探索软硬一体的下一代模型设计,旨在实现训练效率、推理效率、模型性能的多目标优化;

第四,探索下一代 AI 学习范式,挑战现有范式的“共识”,寻找比 Next-Token Prediction 更高效的学习目标;

第五,探索下一个 Scaling 方向,继 Pretraining Scaling 和 Test-Time Scaling 之后,寻找推动智能边界演进的新方向。

五大方向明确地勾勒出通往 AGI 的实践路径。与字节跳动此前快速迭代的机制不同,该项目强调“宽松的研究环境”和“长周期考核”,并为入选课题提供独立算力支持。

(来源:豆包大模型团队)

“Seed Edge”的底气,源于字节跳动在 AI 基础设施上的持续重度投入。据路透社消息,2025 年字节跳动已预留超过 1,500 亿元人民币的资本支出。其中大部分将集中在 AI 领域,约一半将投向海外数据中心和网络设备。如果消息属实,这一规模不仅远超国内同行,甚至也在靠近谷歌、微软等国际巨头——后者 2024 年在 AI 基础设施上的投入分别为 500 亿和 557 亿美元。

(来源:Reuters)

与硬件投入相匹配的是字节跳动在人才领域的布局。

在人才储备方面,字节跳动采取了多管齐下的策略。公开信息显示,2024 年 5 月启动的“Top Seed 人才计划”以极具竞争力的待遇在全球范围内招募顶尖博士毕业生。成立短短数月,团队就取得了显著成果:57 篇论文入选 ICLR、CVPR、NeurIPS 等顶级会议,产出了下载量超百万的开源项目。同时,团队与清华 AIR、北大等近 20 所高校建立了合作关系,共同推进 AI 研究发展。

此外,2023 年以来,字节跳动还从其他大模型相关企业挖走多名核心人才,包括原通义大模型负责人周畅、零一万物前算法副总裁黄文灏等。

从组织架构来看,目前 Seed 专注于基础模型研发;Flow 负责基于大模型的 AI 原生应用研发。知情人士表示团队规模加起来已达数百人,这两支团队构成了字节跳动 AI 研发的核心力量。

这些投入很快就展现出了成效。就在 Seed Edge 项目宣布的前一天,字节跳动发布了具有重大技术突破的豆包大模型 1.5Pro 版本。据称,这一版本在模型架构、效率优化、多模态能力等多个方面都实现了突破。

和国内近期一些较为出色的模型相类似的是,这款模型也同样更强调在模型架构和 AI Infra 层面进行优化,而非算力上的堆叠。

在模型架构层面,新模型采用了大规模稀疏 MoE 架构,在相同算力投入下实现了更高的性能上限。在系统层面,团队通过自研服务器集群方案和网络协议,改善了分布式计算的效率。在多模态融合方面,新版本整合了视觉和语音能力。视觉模块支持灵活的图像输入处理,语音模块则采用端到端框架,简化了传统的语音处理流程。

同时,做 toC 应用起家的字节跳动在 AI 应用方面也表现出了凶残的战斗力。包括占领用户心智极广的豆包在内,字节跳动旗下目前正常运营的 AI 应用超过 20 款,覆盖语言、图像、视频、3D 生成等多个领域。其中,豆包作为核心产品,用户量持续增长,月活用户已达 7,500 万,位居国内同类产品首位。

然而,第三方机构 QuestMobile 数据显示,截至 2024 年底,以文本对话为核心的 AI 产品(如豆包、Kimi 等)用户日均使用时长普遍在 5 至 10 分钟,单次对话轮次不足 5 次。

相比之下,视频生成工具“即梦”被赋予更高战略优先级。该产品由前抖音 CEO 张楠主导,集成 PixelDance 和 Seeweed 等模型,月活跃用户已达 1.7 亿,仅次于 ChatGPT。其战略与抖音早期路径高度相似:降低创作门槛(如“一键生成”模板)、构建社区生态(吸引 AI 创作者发布作品)、试水商业化(部分功能付费)。技术层面,即梦优先应用字节跳动最新视觉模型,例如支持中文精准生成的图像模型,已在电商直播、虚拟偶像等领域落地。

图丨即梦 AI(来源:即梦)

此外,。也于近日推出了 AI 编程工具 Trae,定位为“从 Copilot 到 Autopilot”的升级。该工具由字节跳动新加坡子公司 SPRING 开发,支持自动化代码生成、项目全流程开发,并内置 GPT-4o 和 Claude-3.5-Sonnet 模型免费调用。Trae 兼容 VS Code 配置迁移,瞄准中国开发者市场,直接对标 Cursor 等 AI 集成开发环境。此举被视为字节跳动渗透开发者生态的关键一步,与其此前发布的 MarsCode、Coze 等工具共同构成从代码生成到无代码应用的全链条覆盖。

(来源:Trae)

尽管投入巨大,字节跳动仍面临一系列挑战,这自然也包括这一轮 AI 大模型产品落地中的普遍困境。豆包虽然已经建立了 toB 端的 API 收费模式,但在更广阔的 C 端市场上还有待寻找有效的变现途径:至少,靠 chatbot 对话转化为收入目前依然没有清晰路径。

地缘政治带来的不确定性则是字节跳动面对的另一大挑战,极大概率会影响到公司战略的落地执行。一方面,作为公司重要海外业务的 TikTok 在美国市场前途未卜;另一方面,字节跳动的海外 AI 基础设施建设高度依赖英伟达芯片。。

通向 AGI 的道路充满不确定性,骄傲如 Google 者依然大象转身步履蹒跚。至于字节能否在 AI 时代再出爆款产品,答案或许就藏在“Seed Edge”那些充满不确定性的长期研究课题中。不过,AI 竞争逐渐进入新阶段,字节跳动逐渐展现出其规模优势,资源、资金和人才的储备足以支撑其成为最关键的玩家。

来源: DeepTech深科技

 
最新文章
相关阅读