寒武纪、字节算力需求及摩尔线程上市交流会议纪要

  寒武纪、字节算力需求及摩尔线程上市交流会议纪要

  会议时间:2025年12月5日

  ---

  一、核心观点:从“供给约束”转向“需求为王”的时代

  会议伊始,主讲人张宏达开门见山地提出了对国产AI芯片产业的核心判断:随着时间推移,“供给”和“产能”将越来越不是问题,而“需求”将成为决定公司价值的核心要素。

  · 短期与长期的辩证关系:他承认,在即将到来的2026年,供给可能仍处于偏紧的“紧平衡”状态。但若将视野放远至2027年及以后,产能瓶颈必将被打破。回顾中国各行业的发展历史,鲜有哪个行业能长期受制于供给不足。因此,研究的重心必须提前转向需求侧。

  · 评判公司的黄金标准:张宏达提出了一个清晰且苛刻的评判标准:一家国产AI芯片公司是否具备长期价值和竞争力,关键在于能否获得大型互联网公司的“万卡级”持续、稳定采购订单。这里的“万卡级”不是一次性采购,而是形成了一种稳定的供应链关系。这将成为区分公司发展阶段、估值水平和未来潜力的重要“质量标准”。

  二、字节跳动:算力需求的“十倍速”引擎

  会议将字节跳动作为需求分析的典型案例进行了深入剖析。

  1. 产品生态与市场反响

  · 字节新推出的AI手机市场反响超预期,被认为真正实现了人们对AI手机的想象。更重要的是,这是字节在长时间未推出重磅新硬件产品后的一次成功亮相,其产品稳定性和完成度得到了验证(例如在复杂任务测试中表现可靠)。

  · 字节的独特优势在于其庞大且多元的生态系统(如抖音、懂车帝、番茄小说等),这为其大模型提供了丰富且可直接落地的应用场景。

  2. Token消耗量:揭示真实需求的硬指标

  主讲人指出,评判算力需求最硬的指标是Token(令牌)的日消耗量。字节的数据极具说服力:

  · 2025年初:日消耗量约为4万亿Token。

  · 2025年底:已达到40万亿Token,完美达成年初设定的十倍增长目标。

  · 2026年预期:根据产业调研和字节自身的产品规划,预计其日消耗量将再翻十倍,达到400万亿Token。这一增长源于内部业务调用和外部API服务的双重驱动。目前内部调用约占三分之二,外部占三分之一,未来外部占比有望提升。

  3. 从Token到算力:需求增长的量化推演

  算力总需求由Token消耗量 和 模型参数量 共同决定。

  · Token的驱动力:明年的Token消耗量有十倍增长的明确预期。

  · 模型进化的抵消效应:大模型技术本身在不断优化,完成相同任务所需的模型参数可能减少(例如从需要1000亿参数模型优化到仅需200亿参数)。这意味着,单纯Token增长不会完全等比例地转化为算力需求。

  · 综合判断:在Token十倍增长、模型参数可能减半的假设下,张宏达团队判断,字节对算力卡的总需求在2026年实现3到5倍的增长是较为合理的预期。

  4. 算力卡的需求结构:小尺寸推理模型为主

  字节当前及未来的算力需求主要以小尺寸推理模型为主,服务于推荐、广告、搜索、内容审核等成熟业务。这类场景对卡的性价比和稳定性要求极高,而非极致算力。

  · 现役主力:目前主要使用某型号的580/590等卡以及一些更早期的型号(如P4、V100)。但许多老卡已停产,正逐步进入退役周期。

  · 未来需求:为满足3-5倍的算力增长,预计将主要采购某型号的580/590乃至下一代690等卡。主讲人特别指出,寒武纪(某英式) 在字节体系内因适配早、生态整合深,优势较为明显。

  5. 一个被低估的宏大叙事:“智算”替代“通算”

  张宏达强调了一个常被市场忽视的巨量市场:用智能计算(AI算力)全面替代传统通用计算。

  · 即使AI不创造任何新场景,仅将现有互联网业务(如抖音的推荐、头条的搜索、懂车帝的广告)背后的算法,从传统CPU/通用计算平台迁移到专用的AI推理芯片上,就能带来万亿美元级别的市场空间。

  · 这种替代的驱动力不仅是效果更好,更是成本更优。字节正在实践这条路径,而这正是其推理算力需求持续爆发的根本逻辑。因此,所谓的“AI算力泡沫”论在此逻辑下不攻自破。

  三、寒武纪的竞争力:在关键场景中验证的“稳定性”

  分析师李想随后补充了关于寒武纪具体竞争优势的分析。他指出了一个长期被市场忽视但对客户至关重要的指标:稳定性。

  · 稳定性的价值:在数据中心承担关键推理任务时(尤其是直接面向B端用户、无冗余备份的场景),芯片的稳定性直接关系到服务质量和用户体验。频繁的卡顿、重启是不可接受的。

  · 寒武纪的验证:经过在字节长达一年(自2024年12月起)的大规模实际部署,寒武纪产品的稳定性得到了“充分验证”。其芯片已广泛应用于字节的广告推荐、搜索、文本乃至多模态推理等场景。

  · 架构优势匹配场景:寒武纪采用的DSA(领域专用架构)或ASIC架构,在执行算法相对固定、参数规模较小(通常在百亿参数以内)的推理任务时,执行效率高,性价比突出。在当前以单卡或小集群推理为主的阶段,其通信方面的短板被弱化,而计算效率的优势得以放大。

  · 升级路径清晰:随着字节的算力基础设施从单服务器向大规模集群演进,寒武纪等国产芯片也有清晰的路径,逐步向更大参数模型的推理乃至训练场景拓展。

  四、摩尔线程上市:背景雄厚,绑定大客户

  会议最后简要讨论了当日上市交易的摩尔线程。

  · 股东背景亮眼:其股东阵容涵盖了一线互联网巨头(字节通过量子跃动投资、腾讯投资)和主要运营商(中国电信旗下资本、中银资本等),体现了产业资本的高度认可。联通虽未直接投资,但已有采购使用。

  · 产品线与客户:公司已迭代多代产品,涵盖消费级GPU和数据中心GPU/DPU。目前战略重心已全面转向数据中心。其营收高度集中,前两大客户贡献了约85%的收入,其中第一大客户推测年采购量在5000张卡左右,显示了其已切入核心客户供应链并实现稳定供货。

  · 上市后展望:随着上市后关注度提升和国产化浪潮,公司估值有上升空间。

  五、总结:回归需求本质的投资视角

  张宏达在总结中再次强调核心结论:

  1. 需求主导:投资国产AI芯片,应逐渐淡化对短期产能的纠结,深度研究其下游核心客户的真实需求及增长持续性。

  2. 标杆验证:能否获得互联网大厂“万卡级”持续订单,是检验公司成色的试金石。

  3. 字节案例:字节跳动2026年Token消耗量预计再增十倍,将驱动其算力需求实现数倍增长,为已深入其生态的供应商(如寒武纪)提供坚实的业绩基础。

  4. 市场广阔:“智算替代通算”是比AI创造新需求更确定、更庞大的基本盘,足以支撑行业长期发展。

  ---

  备注:本纪要基于内部会议内容整理,仅供参考,具体数据以公司正式公告为准。如涉及非公开信息,请及时联系下架!