中国 AI,走向世界:新加坡政府放弃 LLaMA,转向 Qwen

  众所周知,现在的全球 AI 竞争的牌桌上,只有中美两个国家,其他国家的人才、算力,都无法支持起自研大语言模型的训练。

  最近,新加坡国家人工智能计划(AISG)宣布,东南亚大语言模型「Sea-Lion」,正式抛弃了 Meta 的 Llama 架构,全面转向阿里巴巴的通义千问 Qwen。

  中国 AI,走向世界:新加坡政府放弃 LLaMA,转向 Qwen

  这是一个值得注意的信号,它标志着,美国科技巨头的 AI 垄断,开始出现了裂痕。全球其他地区的技术倾向已经逐渐从硅谷转移到中国。

  因为,技术,终究要解决实际问题。

从「英语中心主义」到「原生多语言」

  要理解新加坡为何做出如此重大的转向,只需要理解一个基础概念:tokenizer,分词器。

  模型在处理文字之前,需要先通过这双分词器把句子拆分成一个个它能理解的最小单元,即 token。

  问题在于,以 Llama 为代表的西方主流模型,生来就带着浓厚的「英语中心主义」。

  它们擅长处理拉丁字母,但遇到泰语、缅甸语这类非拉丁文字,就开始出现 bug。

  结果是,一个在泰语里完整的单词,会被 Llama 的分词器暴力拆解成五六个毫无意义的碎片。

  这带来的后果是灾难性的:首先,处理同样长度的文本,计算量激增,推理速度大幅下降;其次,上下文窗口被无效的碎片占据,模型的理解能力大打折扣。

  对于一个旨在服务整个东南亚的项目而言,这意味着低效、昂贵,以及对本地文化语境的隔阂。AI 应用的开发效率被这个技术瓶颈死死卡住。

  而 Qwen 的优势恰恰在此。它在预训练阶段就消化了包含 119 种语言和方言的 36 万亿个 token,并为这次合作额外注入了超过 1000 亿个东南亚语言词元。

  中国 AI,走向世界:新加坡政府放弃 LLaMA,转向 Qwen

  Qwen 的分词器天生就是为多语言世界设计的。它能高效地识别和理解东南亚的文字与语法结构,而不是仅仅将它们视为一堆需要费力解码的乱码。

  性能数据是最有说服力的。

  在「东南亚语言模型综合评估排行榜」(SEA-HELM)上,基于 Qwen 构建的 Sea-Lion-v4 模型,迅速登顶 2000 亿参数以下开源模型的榜首。

  中国 AI,走向世界:新加坡政府放弃 LLaMA,转向 Qwen

  更重要的是,经过量化处理的 32B 模型,可以在个人电脑上运行。这意味着 AI 的门槛被真正拉到了中小企业和个人开发者触手可及的高度。

  技术选型,最终回归常识:谁能更好地解决本地问题,谁就胜出。

从技术依赖到「主权 AI」

  如果说技术效率是新加坡转向的直接原因,那么其背后更深层次的驱动力,则是对「技术主权」的战略考量。

  作为一个在全球地缘政治中保持精明中立的国家,新加坡很早就意识到,将国家数字基础设施的未来完全押注在单一技术来源上,尤其是遥远的硅谷,是极其危险的。

  这种依赖不仅意味着要忍受西方模型固有的文化偏见,更意味着在数据安全、法规遵从乃至未来技术路线的演进上,都将受制于人。

  AISG 的决策,是全球中等强国「技术觉醒」的一个缩影。他们追求的「主权 AI」,并非要从零开始自研一切,而是在全球技术版图中,寻找最符合自身利益的组合。

  这催生了一种新的「技术不结盟」策略:在硬件上,可以继续依赖美国的 Nvidia 芯片;但在软件和模型生态上,则可以拥抱来自中国的开源方案。

  这种务实的组合拳,让新加坡得以用最低的成本、最快的路径,构建起一个真正「懂」本地文化、服务本地需求、数据留在本地的 AI 系统。

  Qwen 的 Apache 2.0 开源协议,赋予了新加坡完全的自由度,可以进行深度定制、私有化部署,而不必担心被原始开发商的商业条款所束缚。

  这种模式的示范效应是巨大的。

  当新加坡这个区域技术风向标做出选择后,马来西亚、印尼、泰国等东盟国家也势必会重新评估自己的 AI 战略。

  一个以中国开源模型为基础的「全球南方技术栈」正在悄然形成,它不寻求与西方技术栈直接对抗,而是专注于解决那些被硅谷长期忽视的、碎片化的本地需求。

开源驱动的商业飞轮

  很多人也许会问,我们中国企业投资那么多研究的模型,为什么要开源给全世界用?

  其实,这背后是一套精心布局的「模型-云-应用」三级战略。

  第一级:以 Qwen 开源模型为引爆点。

  通过提供一个性能强大、对商业使用极其友好的开源模型,在全球开发者社区中建立声望,形成生态护城河。Qwen 在全球突破 6 亿的下载量和超过 17 万个衍生模型,已经证明了这一策略的成功。这就像 Google 当年用免费的 Android 操作系统,一举占领了移动互联网的入口。

  第二级:将开源流量引向阿里云基础设施。

  模型是流动的,但运行模型所需的算力是固定的。随着越来越多的东南亚企业和开发者基于 Qwen 构建应用,他们自然会寻找最具性价比和兼容性的云平台。

  阿里云此时在泰国、马来西亚等地大举兴建数据中心,正是为了承接这波由开源模型带来的算力需求。模型与云的深度集成,形成了一个强大的商业闭环。

  中国 AI,走向世界:新加坡政府放弃 LLaMA,转向 Qwen

  第三级:与电商应用生态深度协同。

  这盘棋的最终落点,是服务于阿里巴巴的核心业务。阿里旗下的东南亚电商平台 Lazada、跨境平台 1688,都可以借助 Qwen 强大的多语言能力,为中国商家出海提供 AI 工具,提升商品信息翻译、本地化营销的效率,从而打通整个商业链路。

  用最开放的姿态(开源模型)吸引最广泛的参与者,然后通过最底层的设施(云计算)和最上层的应用(电商)实现商业价值的捕获。

世界需要多元化的 AI

  新加坡弃用 Meta,选择阿里预示着,全球 AI 的发展范式正在发生根本性转变。

  过去,世界只有一个中心——硅谷。它定义标准、输出模型、主导话语权。其他国家和地区,或多或少都是其技术秩序的接受者。

  而现在,一个新的极点正在东方形成。中国开源模型绕过了美国在高端芯片上的封锁,渗透到世界的每一个角落。

  对于新加坡这样的国家,以及广大的发展中世界而言,这无疑是最好的时代。

  巨头之间的竞争,为它们创造了前所未有的选择空间。它们不必再被动接受,而是可以主动选择,甚至组合出最适合自己的技术路径。

  当英伟达 CEO 黄仁勋和爱彼迎 CEO Brian Chesky 都公开承认 Qwen 的市场地位和优越性时,这已经不仅仅是中国公司的胜利,而是开源精神对封闭体系的一次胜利。

  技术的终极价值,正在于此。