刘权:“90后”讯飞星火大模型领头雁
科大讯飞股份有限公司AI研究院副院长,认知智能全国重点实验室的青年领军人才,首个国产自主可控、效果业界一流的讯飞星火大模型研发者之一......这一串沉甸甸的荣誉成果,来自年仅34岁的青年刘权。
“90后”刘权十余年的“科创路”走得坚定、艰难,却熠熠闪光。
敢闯“无人之境”
“刚开始研究时,该领域参与的学校和研究者都比较少,知识库没有现成可获取的,技术本身和系统评价都是难题。”刘权说。
2012年,刘权加入了中国科大语音及语言信息处理国家工程研究中心,开展自然语言处理(Natural Language Processing,以下简称“NLP”)方向的研究。
当时他所在的实验室,同届十几名研究生同学都选择了语音识别、语音合成等热门和实验室优势方向,他独独钟情于自然语言处理。导师曾语重心长地劝他:“如果选择这一方向,毕业可能有风险,你考虑清楚了吗?”
刘权没有太多犹豫,因为兴趣爱好坚定了自己的选择。“在研一导师安排的一个项目中接触了半年文本处理技术后,自己对从事自然语言技术研究的热情快速上升,让机器理解人类语言这件事情非常有趣。”刘权说。
2014年,科大讯飞开启“超脑计划”,希望全面打造认知智能引擎,实现“从让机器能听会说、到能理解会思考”。同年,刘权成为了“超脑计划”的一号研究员。“当时正值深度学习技术飞速发展的初期,感知智能技术取得了大幅突破,NLP领域也正在掀起一轮技术革新。”刘权告诉记者,基于深度学习的自然语言处理技术不断发展与突破,也逐步应用在科大讯飞多项产品中,“举个例子,汽车智能导航系统中,保证系统收到语音并识别成文本后,能够理解文本语义与用户意图、完成对话系统响应及回复,就是我当时的工作之一。”
2017至2022年,刘权主导研发了业界首个支持全双工自由交互的中文语音对话系统,并在智能汽车、智慧家庭等场景实现了大规模应用落地。
五个月 培育“最聪明”的大模型
2022年11月底,ChatGPT横空出世,就像是一颗巨石,在全球人工智能领域激荡起阵阵涟漪。刘权是讯飞研究院内第一位“触摸”涟漪的人。
“在相关领域深耕了很久,看到这个成果,我非常兴奋。它不仅可以智能回答人类的各类问题,在大量自然语言处理任务上的效果也非常惊艳。”回忆起当时的场景,刘权的语气仍有些激动。兴奋之余,压力也接踵而至。
新的挑战出现了。时代的浪潮中,不进则退,只有迎头赶上。那年年底,依托认知智能全国重点实验室,在公司的支持和统一调度下,刘权牵头带领团队,开展讯飞星火大模型核心研发攻关工作。
“第一个模型训练完成后效果很不理想。”刘权记得,2023年春节后回来的那次测试,让整个团队都有些紧张,“精心培育的幼苗,长势却不尽如人意。可时间紧、任务重,大家一刻都不敢松懈。”
经过连续数周的高强度攻关,持续不断地更新迭代,三个多月的时间,他们不仅克服算力被限等诸多困难,还创新性地提出无监督数据高效构建及处理方法、有监督指令自进化方法、行业知识融合学习算法等技术,促使大模型的测试分数从30多分一路攀升到70分。
3月底,这项成果在企业内部会议上第一次“公开亮相”。“那天,董事长和各位领导都在现场。大家现场对研发的讯飞星火大模型雏形系统提了不少问题,我们做了现场测试和效果展示。”回忆起两年前的那天,刘权印象深刻,仿佛就在昨日,“模型对答如流,现场也响起了掌声。那一刻,大家都很激动。”
这次成功亮相,也敲定了讯飞星火大模型的发布日期——2023年5月6日。当年8月,《麻省理工科技评论》对中国主流大模型能力的评测报告中,讯飞星火大模型V2.0以81.5分(百分制计)的成绩在本次评测中登顶,当时被誉为中国“最聪明”的大模型。
让国产大模型“持续向前”
今年11月6日,深度推理大模型讯飞星火X1.5发布,在全国产算力平台上攻克MoE模型全链路训练效率,在模型参数小一倍的情况下对标国外领先水平,其多语言能力超130种,为世界提供第二选择,并推动教育、医疗等行业大模型能力升级。在自主可控的技术底座技术上,科大讯飞发布了融合AI+麦克风阵列、AI+扬声器阵列等软硬件一体的解决方案以及多模态交互能力,更围绕“更懂你的AI”发布或升级了教育、医疗、汽车、办公等多个领域的AI新产品。
“我们大模型最难得的不仅是‘聪明’,还有‘自主可控’。”刘权告诉记者,讯飞星火大模型是迄今为止唯一在国产化算力上训练且持续进步的大模型,走了一条最难但最“安全”的路——讯飞与华为联合构建国产算力平台。一直以来,讯飞星火大模型在全国产化平台上完成多次迭代升级,在研发上受限多、难度大,但在国产自主可控上具有无可比拟的优势。
“大模型研发不是三两年就能分出胜负的,AI这条路还有很长的路要走。”刘权说。在当前激烈的中美AI科技竞争态势下,国产化算力上训练大模型的过程极为艰苦,需要适配和优化的工作极多、周期很长,为保持大模型竞争力需要付出额外的巨大努力,同时需要有昂扬的奋进精神和创新意识。
现在,讯飞研究院在大模型研究领域的青年研究团队,已经从当时的数十名拓展到数百名,过去几年,他们完成了讯飞星火大模型的十余次重大迭代升级。目前,他们采取“双线作战”的方式:一方面在底座模型层持续创新,确保讯飞星火大模型在行业内的领先地位;另一方面深入教育、医疗等垂直领域,让AI为更多行业赋能。“不在乎一时快慢,重要的是持续向前。”刘权说。(见习记者 陈 璐)

刘权(右一)和研究团队成员
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。
