端侧AI NPU IP双雄:安谋科技Arm China、芯原股份的差异化竞合之路

  【摘要】中国NPU IP产业自2017年进入商业化突破期以来,一大批本土优势企业,脱颖而出。

  作为其中的佼佼者,安谋科技Arm China和芯原股份分别以生态主导和平台主导为战略,走出差异化的国产崛起路径。

  当端侧AI浪潮滚滚袭来,他们又将聚焦怎样的共性需求,在细分领域实现技术护城河?他们之间的合作与竞争将怎样推动中国半导体IP行业的进步?

  以下为正文:

  当微软明确“AI PC需内置不低于40TOPS算力NPU”的技术标准,当戴尔Pro Max Plus移动工作站以独立NPU重构AI运算架构,神经网络处理单元(NPU)已从手机芯片的辅助模块,升级为端侧智能的核心计算部件。在国际巨头构建的技术壁垒下,中国本土NPU IP产业完成了从跟跑到并跑的积累,如今以安谋科技Arm China、芯原股份等为代表的国产企业,在端侧AI的爆发周期中走出了不同的发展路径。

  01

  中国NPU IP的发展脉络:从技术探索到产业爆发

  NPU的技术源头可追溯至1943年人工神经网络数学模型的提出,但真正走向产业化始于移动智能时代的需求驱动。整体来看,中国NPU IP产业的发展大致可分为三个阶段。

  2017年以前,中国NPU IP产业处在技术孕育期中。此时全球AI尚处于深度学习复兴的初期,NPU概念刚在学术圈形成共识,国内企业以寒武纪为代表,率先开展神经网络处理器架构的探索,为后续产业化积累核心技术。

  这一阶段以产学研联动为核心特征,技术方向聚焦于基础算法与硬件架构的匹配性研究,尚未形成明确的商业路径。

  2017至2022年,整个产业迎来商业化突破期。2017年,华为在Mate 10手机中集成基于寒武纪架构的NPU,苹果则在iPhone X的A11芯片中引入自主NPU,两大终端巨头的动作彻底激活了NPU的商业价值,自此,中国NPU IP产业迎来商业化元年。

  这一阶段的产业驱动来自智能手机的AI功能需求,智能抠图、语音助手等应用推动NPU IP技术快速迭代。数据显示,中国NPU市场从2018年的9.7亿元飙升至2022年的超100亿元,年复合增长率超80%。

  2023年以来,产业进入生态扩张期。生成式AI向端侧渗透,使NPU的应用场景从智能手机延伸至AI PC、自动驾驶、智能穿戴等领域。PC领域,2024年微软提出“AI PC”概念,要求内置不低于40TOPS算力的NPU,直接推动PC领域的NPU普及;智能汽车领域,ADAS系统对NPU算力的需求也大幅提升。

  这一阶段的显著特征是应用场景从移动终端向多元化延伸,政策层面,国家发改委与工信部通过政策引导,支持NPU在物联网与边缘计算中的落地,推动产业成熟。数据显示,截至2024年,中国NPU市场规模达169.44亿元,年均复合增长率超50%,本土NPU IP企业在技术自主化程度和商业化落地能力上均有明显提升。

  目前,全球NPU行业已形成“国际巨头主导、本土企业快速追赶”的多层次竞争格局。

  作为IC产业链的上游环节,半导体IP行业具有技术水平高、知识产权高度聚集,商业价值大的特点,海外公司垄断优势明显。据统计,Synopsys和ARM在2023年全球IP市场份额中合计占比超过六成,我国的芯原股份成功挤进全球前十行(位于全球第八,国内第一),但是芯原股份的全球市场份额仅为1.9%,半导体IP行业整体呈现明显的头垄断格局,国产替代需求迫切。

  02

  芯原股份VS安谋科技:平台服务型VS生态主导型

  在本土NPU IP企业中,安谋科技Arm China与芯原股份的发展策略颇具代表性。两者均聚焦半导体IP赛道,但基于自身资源禀赋的差异,形成了“生态主导型”与“平台服务型”两种发展模式。

  安谋科技Arm China聚焦大模型,核心思路是贴合端侧大模型的运行需求,从硬件底层优化计算效率。其2025年推出的“周易”X3 NPU IP,采用专为大模型而生的DSP+DSA混合架构,通过专用计算单元与灵活处理模块的组合,缓解端侧大模型运行中的算力与带宽压力。

  这种架构设计以匹配大模型计算特征为目标,相较于上一代“周易”X2,其CNN模型性能提升30%-50%,多核算力线性度达到70%-80%。同算力规格下,AIGC大模型能力提升10倍,Llama2 7B大模型Prefill阶段算力利用率高达72%,Decode阶段有效带宽利用率超100%,充分释放硬件潜力,远超行业平均水平。

  端侧AI NPU IP双雄:安谋科技Arm China、芯原股份的差异化竞合之路

  芯原股份采用多架构适配策略,依托在GPU、VPU等IP设计领域的积累,搭建支持多类神经网络模型的NPU IP平台。其NPU IP不绑定特定架构,通过可配置计算单元与开放接口设计,满足消费电子、汽车电子等不同场景的需求。

  这种策略的核心优势是降低客户适配成本,能够快速响应不同行业的定制化需求,这也是其在国内fabless客户中渗透率较高的原因之一。

  端侧AI NPU IP双雄:安谋科技Arm China、芯原股份的差异化竞合之路

  在商业模式方面,安谋科技Arm China采用生态主导的策略。其通过“硬件IP+软件工具+开发套件”的一体化方案增强客户粘性。“周易”X3除硬件IP外,还配套了模型优化工具、驱动程序及应用开发接口,帮助客户加速大模型的端侧部署,形成了从IP到终端,再到应用的生态联动效应。

  芯原股份则坚持平台开放策略。其NPU IP支持与第三方工具链、算法模型兼容,不强制绑定自有软件生态。这种模式的核心是降低客户迁移成本,对于已采用第三方算法或工具链的客户而言,接入成本低于封闭生态的IP产品。同时,芯原提供从IP授权到流片支持的全流程服务,提升合作便捷性。

  整体而言,安谋科技Arm China的优势在于大模型适配能力和成熟生态,主战场是复杂高阶AI场景;而芯原股份的优势是IP种类丰富,其IP种类在全球排名前十的IP企业中排名前二,且定制化灵活,能满足不同客户从低功耗到高性能的多样化定制需求。

  03

  端侧AI机遇:共性选择与差异路径

  端侧AI已成为NPU IP产业的核心增长引擎。根据弗若斯特沙利文预测,2025年全球端侧AI市场规模将达到3219亿元,2029年猛增至1.2万亿元,复合年增长率高达39.6%,端侧AI正成为人工智能发展的新战场。中国端侧AI市场规模的增速同样明显,将从2025年的802亿元攀升至2029年的3077亿元,复合年增长率高达39.9%。

  端侧AI的快速发展为NPU IP产业带来机遇,AI PC、智能手机、自动驾驶汽车等终端产品均需NPU作为AI计算核心,这为本土NPU IP企业带来巨大机遇。

  头部企业普遍认识到,单纯的硬件IP授权已无法满足端侧AI需求,硬件IP+软件工具+算法优化的一体化方案成为行业主流。

  安谋科技Arm China“周易”X3在强调硬件性能的同时,升级了软件生态,通过模型量化工具、推理引擎等组件加速大模型端侧落地;芯原股份依托全流程服务能力,提供IP定制与算法适配的一体化支持;华为海思则通过MindSpore框架与达芬奇架构NPU的协同,实现端云协同的AI部署。

  这种趋势本质上是端侧AI需求从具备算力向高效用算力的转变。

  在共性需求之外,各家企业基于自身优势形成差异化的端侧AI布局策略,具体可以分为三类:高端突破、中低端覆盖与垂直深耕。

  安谋科技Arm China选择高端突破路径,聚焦AI PC、旗舰手机等高端端侧设备,凭借“周易”X3的性能优势与大模型适配能力,争夺全球高端NPU IP市场。其目标客户是国内外头部消费电子芯片厂商,试图以高端市场突破树立技术标杆,带动中低端产品销售。

  芯原股份走中低端全覆盖路线,借助可配置化IP与低成本适配能力,渗透智能穿戴、智能家居、入门级手机等中低端场景。这些场景单价较低,但市场规模大,芯原通过“以量取胜”实现营收增长,2024年2.5%的全球市场份额即源于海量中低端端侧设备的支撑。

  地平线选择“垂直场景深耕”路径,避开通用端侧市场的激烈竞争,聚焦自动驾驶领域。征程系列芯片的NPU IP针对自动驾驶优化,支持多传感器融合与复杂环境感知,以场景专用化建立竞争优势。

  04

  尾声

  中国本土NPU IP产业的发展,是中国半导体产业从技术跟随到自主创新的缩影。

  安谋科技Arm China的生态主导与芯原股份的平台开放虽路径不同,但都为本土产业发展提供了实践经验。

  值得注意的是,中国NPU IP产业的竞争并非零和博弈,而是要竞合共生。

  竞争,决定了产业发展的“效率”与“高度”。多个玩家在算力、能效、易用性上的比拼,可以驱动技术快速迭代,迫使国产企业突破极限;

  而合作,则奠定了产业安全的“广度”与“底线”。在外资巨头的垄断背景下,诸多玩家在工具链开发、标准制定等领域形成协同,为整个中国芯片产业提供了宝贵的生态厚度,降低了系统性风险。

  只有这种既竞争又合作的格局,才能成为推动产业快速迭代的重要动力,也为中国半导体在上游IP领域筑牢着最坚实的根基。