当前位置: 首页 >> 互联网

科大讯飞不留退路

作者：韩子文

来源：降噪NoNoise

时间：2023-10-26 10:59

科技行业有个共识：技术的发展不是均匀的，而是以浪潮的形式演进。置身其内的每个人，都应该看清楚浪潮，赶上浪潮。

不过对于科技公司来说，看清和赶上浪潮都是有门槛的。看清的前提是对技术趋势作出准确判断，赶上则要求速度和长期积淀缺一不可。在此基础之上，企业所处的不同生态位、不同「家世背景」，将决定各自在变革浪潮中所扮演的不同角色和使命。

比如在大模型打开的美丽新世界中，科大讯飞就属于不留「退路」的一类。它专注人工智能20多年，终于等来这个足以开启增长新时代的技术大浪。为了成为其中的引领者，这家公司急切地立下一系列精确到日的Flag——

今年5月发布讯飞星火V1.0时，董事长刘庆峰当场宣布，8月15日发布星火V2.0，实现多模态能力；10月24日发布星火V3.0，全面对标ChatGPT（中文超越，英文相当）。

这一迭代时间表甚至被写进了讯飞三季度财报。

在这个背景下，科大讯飞全球1024开发者节成为了现场验收时刻。

根据国务院发展中心国研经济研究院的横评报告，星火大模型综合能力已超越ChatGPT，且在教育、医疗和法律行业表现尤为突出。「整体超越ChatGPT、医疗领域超越GPT-4」，台上的刘庆峰声音沙哑却铿锵有力。事实上，他全程情绪激奋、频繁挥动手臂，把一场发布会开出了军事动员大会的即视感。

台下一名深受感染的合作伙伴说，「老刘技术出身，但真适合营销，太有激情了。」

在展示了星火大模型在教育、医疗等领域的落地能力后，刘庆峰又立了一个新的Flag——2024年上半年对标GPT-4，「这绝不仅仅是一个简单的技术对标问题，我们要走出自己的技术路线，走出自己的产业方向，形成自己完整的生态。」

会后受访时，他回应了讯飞看似激进的时间表背后的动因，「这（注：通用人工智能）是我们所有人的梦想和发自内心的追求，不想留后路。当然，要科学的不留后路。」

熟悉讯飞发展历程的人大概都清楚，这是一家典型的技术公司，1999年以语音切入人工智能领域后，讯飞对技术领先的追求近乎执拗。在其公司战略「顶天立地」中，「顶天」指的就是追求核心技术领先。这种雄心也奠定了讯飞在智能语音领域的龙头地位。

但在上一波人工智能浪潮（2016年-2019年）中，讯飞虽然打开了知名度，当时的主场却是计算机视觉四小龙的，不像这波认知大模型浪潮，基底是自然语言处理，上面叠加多模态，属于讯飞的优势领域之一。

刘庆峰加了限定词「科学」，想强调定时间表不是拍脑袋想出来的，「当时不了解讯飞的人可能在看笑话，但目前证明，基本上每个时间点都是实现的。」

他将原因归结为讯飞过去十多年在自然语言处理领域的技术积累、产品和场景落地经验，尽管其间踩过很多坑，也曾受到争议和质疑，但内部对技术实现的每一个环节是很清楚的，所以敢于「吹牛」。

这当然是理想的一面。

未被谈及的另一面或许与捍卫生态位有关。童话故事《爱丽丝漫游仙境》中，红皇后曾告诫爱丽丝：「你必须尽力地不停地跑，才能使你保持在原地」。由此演化而来的「红皇后假说」提醒着每一位行业先行者：在大的时代机遇面前，你要始终比竞争对手跑得更快。

星火大模型到了哪一步？

讯飞在大模型上跑得够快吗？

首先明确一点，告别卷参数阶段以后，大模型「跑得快」的标准正变成好用和实用。在本月初的一场AI行业大会上，被问到国内哪几个大模型更好用时，两名营销圈人士分别提到讯飞星火，「尤其在教育领域，优势明显」。

刘庆峰在会上透露，自讯飞星火9月5日对公众开放以来，当前已有1200万用户。升级到V3.0后，讯飞星火在七大能力——文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态上有了持续的提升。

比如做数学题时能自动提炼规律——即观察一个新的算式，它可以自己发现规律，然后解决新的问题；也可以跟随指令，帮助孩子在人机共创下制作出有趣的有声绘本。

如果说以ChatGPT为代表的生成式AI带来了交互方式的变革，从讯飞的现场演示中，我们多少能看到这一技术路线的演进方向——从多轮对话到主动对话，然后跨越到启发探究式对话。

每一步交互方式的阶跃，理论上都孕育着大模型走向「实用」的机会。多轮对话交互是个人助理、智能客服类产品的载体；而具备主动对话和启发式对话能力后，大模型在教育领域有望像老师一样，对孩子们的学习因材施教；在医疗领域辅助医生诊断、作出用药建议；在心理学领域，如心理医生一般深入交谈，帮助问诊者对创伤和冲突寻因。

据《降噪NoNoise》了解，心理咨询被认为是大模型能发挥作用的最佳场景之一。京东健康相关人士此前透露，机器部分性能甚至可以比人工表现更好、更稳定。

讯飞本次也发布了面向学校场景的AI心理伙伴，在灌入10亿+条心理类数据、40万+篇期刊文献、100万+通脱敏心理对话案例、550万+个心理评估数据后，该AI心理伙伴据称可以「听懂」孩子心事，给出解决问题的个性化指导建议，并在对话结束后第一时间生成心理咨询报告，同时将需要预警的信息发给心理老师。「孩子们通常不愿意跟家长和老师敞开心扉，只有通过AI的启发式对话，才有可能真正解决大量孩子的心理减压和疏导问题」。

尽管全面对标ChatGPT，刘庆峰也承认，国产大模型必须正视和GPT-4的差距。「国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT4还有差距。」

在纷纷宣布完成对ChatGPT从0到1的技术追赶后，国内人工智能第一梯队的公司已经进入更复杂的环节：一方面基础大模型要继续全面对标GPT-4，甚至走出自己的技术路线；另一方面，要找到爆款行业应用，就像2010年前后《愤怒的小鸟》、Instagram之于App Store。

毕竟未来谁能够获得最多的用户反馈和数据，谁就能进一步增强自身大模型的竞争优势，让飞轮转动起来。

大模型收费的前提是社会刚需

在一场大模型发布会中，有关商业化路径的问题几乎成为标配。

大模型的训练及运行成本极高：坊间传闻GPT-4一次训练成本估计要6300万美元，且由于每次提问都需要进行大量新的计算，难以形成标准软件的规律效益，企业投入成本是个不小挑战。

强如微软，其首批生成式AI产品中的代码服务GitHub Copilot已经陷入亏损。全球大模型类产品中，目前能够实现盈利的只有一个Midjourney。

讯飞的思路是先深入行业，满足社会刚性需求。说白了，先从好用到实用。刘庆峰有个判断，像讯飞星火App一类的C端个人助手，可以让公众更加直观了解大模型，先用起来；但真正能带来行业价值的还是做生产力工具。

要成为一个能收费的生产力工具，关键还要看产品是否真正解决刚性需求，而不是可有可无的东西。

在上一轮AI技术低谷时，第四范式创始人戴文渊曾提到AI落地时所面临的窘境，「现在几乎没有企业不用到AI的技术，但是如果说哪个企业把AI拿掉后活不下去，这样的企业也很少。」

腾讯云智能负责人、优图实验室负责人吴运声此前也分析过to B端的诉求，「企业需要的是在实际场景中真正解决某个问题，而不是在100个场景中解决70%-80%的问题。」

讯飞显然也看到了这一点。去年12月15日启动大模型攻关项目时，其内部就定下「1+N」同步并行推进的模式，1是基础大模型，N则是行业应用。

从一开始就设计应用场景，或许与讯飞此前长期探索AI领域的商业化落地有关。早期讯飞AI技术很强，但忽视市场需求，导致C端产品叫好不叫座，由此走过一些弯路。即便在上一波AI浪潮中，技术变现的挑战始终存在，尤其在互联网大厂掀起免费大战后，外界更为关注讯飞的商业模式能否支撑起千亿市值。

此后讯飞在教育、办公、医疗、法律、工业、智能硬件等领域逐渐探索出商业变现模式。2023年上半年，讯飞开放平台及消费者业务营收占比已经达到30.9%。

行业大模型阶段，也对竞赛选手的能力提出新型要求。如果说通用技术的比拼如同射箭比赛，业内已有的评价维度相当于已经画好了箭靶，各家卷技术评分即可：到了深入行业阶段，各家首先拼的是对行业的理解深度，用讯飞研究院院长刘聪的话说，比的是「画靶子」的能力。

以教育为例，一个有关「小学生英语学习」的大模型，首先需要了解小学英语的学习目标、定义学习范围、词汇量范围、语句类型、语句长度等指标不能超纲，同时还要找到适合孩子学习习惯和学习阶段的方法——这些标准都要先定义，即「画靶子」。

在这个过程中，如果大模型厂商没有做过行业，很难描画出精准的靶心。像本次讯飞发布的具备英语AI答疑辅学的讯飞AI学习机、全新升级的智能编程助手iFlyCode2.0、教育领域的AI心理伙伴、医疗领域的晓医助手等，均离不开过往的行业积累。

除了结合自己主营业务发布AI原生应用，讯飞还与法律、工业、智能汽车等12个行业龙头联合发布行业模型，这样不仅能「画靶子」，叠加专业的团队储备和数据积累，更有机会做出真正适用行业的大模型。

刘庆峰预计，到2024年，大模型给讯飞带来的整体商业收益将会有明显体现。今年5月宣布讯飞星火V1.0内置到AI学习机后，讯飞学习机的销量增长超过200%。

当然前提是大模型的实用性得到市场认可。讯飞在会上也对外公布了一组大模型赋能前后，工业互联网平台对企业吸引力的变化：工业大模型羚羊平台9月20日发布后，短短一个月零3天，用户总量增长59%。在过去一年半以上的时间，该工业平台总共积累了43万用户、累计提供服务近200万次；而在过去短短的一个月，用户增加了25万，提供服务新增170万次。

据我们了解，不止讯飞，各大模型厂商在商业化上都处于边走边看的探索阶段。

星火如何燎原？

这个阶段仍离不开拼速度。

刘庆峰的紧迫感很强。会后接受媒体群访时，他说，「我们有一堆想法要赶快落实，这些想法已经在算法上验证过，就等时间去干。所以明年新增毛利分配我们会全部投入到大模型研发，至少明年还没到关注投入产出比的时候。」

言外之意，技术目标仍是第一位的。这是应用生态繁荣的基础。

今年以来，讯飞凭借强技术的理念，逐渐打开国际市场。不久前在日本大阪公立学校系统的英语口语与写作项目中，讯飞成为单一来源服务商。大阪2025年将要办世博会，希望通过接入讯飞的产品提升学生的英语水平。

生态平台方面，自5月6日星火发布以来，讯飞开放平台新增143.4万开发者团队，同比增幅331%，其中新增大模型开发者17.8万。大模型也显著降低了开发者门槛，在讯飞星火上，已有1.5万助手开发者，开发超2.9万个助手应用。

「现在就是把速度干得更快。」在立下明年上半年对标GPT-4的里程碑后，刘庆峰说，技术方向已经看得很清楚，只是仍受制于时间和算力。在算力上，讯飞宣布与华为联合推出基于昇腾生态的自主创新大模型算力底座「飞星一号」平台，支持讯飞星火大模型实现更大规模的训练。

在上一波人工智能浪潮中，虽然同样喊出AI赋能千行百业，讯飞这类老牌技术公司跑得有点磕磕绊绊，同时还要遭受互联网巨头的挤压。

中国大模型发展增长态势

图源：《中国人工智能大模型地图研究报告》

若不是从这波大模型浪潮中脱颖而出，外界可能根本不会意识到，讯飞并未止于智能语音，而是早就知把AI研究深入到更广阔的认知智能领域，并先后搭建讯飞超脑、认知智能全国重点实验室等平台。

同北上广的互联网大厂相比，这家偏安合肥的技术公司，储备着1000多名科研人员，这支成建制的科研体系有并不逊于互联网大厂的人才储备，甚至当互联网大厂因频繁业务调整，削减对前沿技术研究的投入时，合肥似乎表现得更有定力。

这大概是讯飞在今年能够快速推出星火大模型、并不断高调立下各种Flag的底层原因——相信技术浪潮总会涌来，然后持续投入，确保自己一直留在牌桌上。

等浪潮真的来了，赶上它。

正如福特汽车创始人的那句至理名言——关于未来，无论你觉得行还是不行，你终将都是对的。

关键在于行动。能否构建中国自己的大模型，大抵也是如此。

免责声明：本文系转载，版权归原作者所有；文章内容仅供阅读，不构成投资建议，请谨慎对待。投资者据此操作，风险自担；旨在传递信息，不代表钛狐网观点和立场。

今日热门