大模型走到下半场,真正的“卷点”应该在哪?

大曼 2024-07-05 14:46

一方面,让普通人以更小的成本,去了解和使用大模型和AI应用;另一方面,企业也能在不断的AI应用中,了解模型使用的具体场景,以及能带来的实际价值。

自2022年底大语言模型面世以来,全球范围内便掀起了新一轮AI浪潮,有的甚至最快是“以周为单位”进行产品迭代。

根据一些公开资料,截至去年10月,国内发布的大模型就已超过230个,而6月份的时候这一数字还不到80个,短短4个月的时间就翻了近三倍。“百模赶考”实至名归。

然而行业走到今天,有不少从业者发现,大模型的终点并不在数量的多少,诸如“我们真的需要这么多模型吗”“模型之间卷规模到底有没有用”“那真正的卷点应该被设定在哪”等这般话题,正被业内反复讨论。

产生这种质疑之声的原因,其实不难理解。毕竟放眼于应用层,除了基于开源大模型不断调优的“套壳应用”,真正称得上“能干”的应用,却是凤毛麟角。

这也正如百度创始人李彦宏在上海世界人工智能大会上所说的,“AI时代,‘超级能干’的应用比只看DAU的‘超级应用’更重要。”换言之,在广泛的、实际的场景中,企业真正需要的是超级能干的应用,有能力去解决实际问题,而不只是一个看似很大的超级应用。

随着大模型“卷应用”的浪潮逐步在金融、交通、政务等领域落地开花,更多的人开始意识到,生成式AI的下半场,或许更大的机会在应用上。而中国的AI产业,有望从应用层实现弯道超车。

警惕“超级APP陷阱”

从PC时代到移动互联时代,互联网产品的形态与发展路径,是截然不同的。

近二十年前,受限于通信技术与硬件水平,软件产品的容量不可能做得太大,承载信息的能力自然也有限。

随着硬件算力和通信技术的发达,智能手机作为应用终端,开始成为信息集散地。在这个时代成长起来的互联网大厂,无一不靠大DAU,大用户量的“超级APP”,触及用户生活的方方面面。也据此完成了“前AI时代”的资本积累。

当互联网走入生成式AI时代,以往“一个超级APP”走天下的逻辑,是否还能通用?但如今,这也变成了一个值得商榷的问题。

毕竟此前几乎无人可以预见,在人工智能时代,用户最常用的AI功能是什么。到目前为止,C端用户最常使用的AI功能,多用于文档解析、初级文案生成,文生图、文生视频虽然在商业领域已经有初步引用,但水平依旧无法在短时间取代专业人士。

基于同样的原因,虽然底层模型已经初步产生马太效应,资源和商业效益开始向头部大厂聚集,但像移动互联网时代超过1亿日活的“现象级应用”,却尚未诞生。其中一个原因,是大语言模型的所有能力,尚未被应用层开发者挖掘完毕。

与之相对的是,除了少数行业人士,市场对于生成式AI应用的认知和关注点,更多落在基础模型的进展上。而李彦宏和百度,则更多希望通过站位未来,来调控这艘大船今天的业务方向。

相较于移动互联网时代动辄比拼DAU规模,李彦宏认为,不同时代下,应用的发展路径和模式都是不一样的。避免掉入“超级应用陷阱”,不要用移动时代的思维看问题,这是其在本次大会上给出的一个结论。

在他看来,AI时代下,“超级能干”的应用远比只看DAU的“超级应用”,来得更加重要。“只要对产业、对应用场景能产生大的增益,整体的价值就比移动互联网要大多了。”李彦宏如是说。

仔细想来,其实这并不难理解。

眼下及未来很长一段时间里,如果再像移动互联网时代那般,把绝大多数精力放在底层模型,一来,不断地重复开发基础大模型,也是对社会资源的极大浪费;二来,也是更重要的是,这或将错失更大的机会,特别是锚定产业价值层面的机会。

卷模型与卷应用,从来不是二选一

在人们讨论AI大模型数量过多的时候,伴生而来还会注意到另一个现象:数百个大模型问世,这些大模型之间的差异性到底体现在哪儿?而仅从国内生成式AI的竞争演变,就能看出这个情况——

过去一年多,无论是模型层还是应用层,都出现了从“百模大战”到“补贴大战”的转变,起码在底层模型层,行业已经出现相对饱和;另一方面,行业出清的迹象已经产生。以文心一言为代表的世界领先水平的一批国产大模型已经出现。

从过往连篇累牍的报道中也能发现,从无到有训练一个底层大模型,数亿乃至数十亿的资本投入、一卡难求的算力投入、可遇而不可求的AI细分行业人才,只是万里长征第一步。后续的模型迭代、生态培养等成本,远非中小AI团队可以承担。

正因如此,对于行业的大多数人来说,除非是成规模的大厂,抑或是拿到“龙傲天”剧本的明日之星,卷模型都是一个“无底洞”。无论是积累用户,抑或是解决实际场景下的实际问题,都是应用层的机会更大。

而在这个过程中,行业大模型有关开源、闭源谁更具有优势的争辩,一直未曾停止。

支持开源的行业人士认为,开源模型的意义,在于所有团队都站在一个起跑线上,拿着同样的厨具和食材,能炒出什么样的菜,各凭本事,这是一种公平竞争。

但大模型的开源,或许与一般意义上的软件开源,存在根本上的差异。譬如一般软件开源时,开发者可以获取软件的源代码,并据此修改或者增加新功能。

大模型内部代码,则分为预训练代码、微调代码和推理代码三层,对于微调代码,市场上已有很多公开方法。而大模型要被用起来,需要推理代码,至于训练过程和数据集,往往也是大模型厂商的核心所在。此外还有算力层面的考量。

在这种背景下,拥有经验证商业模式的闭源模型,更适合在竞争激烈的大模型行业里聚集人才和算力,进而实现商业化落地。这也是李彦宏的判断。

尽管在大会上,他并未否定开源在某些环境中的使用价值,但他也提到,“当你处在一个激烈竞争的市场环境当中的时候,你需要是让自己业务的效率比你的同行更高,成本比你的同行更低,这个时候商业化的闭源模型是最能打的。”

当然更值得强调的是,“没有应用,光有基础模型,不管是开源还是闭源都一文不值。所以,我从去年下半年就开始讲大家不要卷模型了,要去卷应用。”

李彦宏透露,在更通用的领域当中,比如说代码生成,像文心快码这样的软件,在不同的领域正在逐步的渗透,“而在百度内部,我们有30%左右的代码,已经用AI生成的,代码的采用率超过了44%。”

下一个爆发点在哪?

无论是重构的百度文库,抑或是作为底层模型能力终端的文心一言,都只是生成式AI应用落地的初步形态。在李彦宏看来,智能体是大模型落地最有前景的发展方向,也被认为是最接近AGI的方向。

从具体功能来看,智能体不止有对话能力、还有反思、协作能力。在未来的行业应用上,多个智能体协作,去解决复杂的任务,将是非常前沿的技术趋势。某种意义上说,这也是“超级能干”的又一种体现。

“制作一个好的智能体通常并不需要编码,只要用人话把智能体的工作流说清楚,再配上专有的知识库,一般就是一个很有价值的智能体了。”随着基础模型的日益强大,开发应用也越来越简单了,智能体也成为李彦宏最看好的AI应用方向之一。

事实上,百度对于智能体的布局较早。早在去年4月份,基于文心一言的文心智能体已经上线。今年6月,中国工程院朱有勇院士及团队与百度共同打造的首个农业智能体——“农民院士智能体”正式发布。

智能体学习朱有勇院士的研究成果以及相关的农业知识之后,农民只需通过简单的提问,就能得到关于旱地稻种植条件、培育技术、病虫害防治等实际问题的专业解答。

值得一提的是,在文心智能体的平台上,已经有16万多名开发者和超5万家企业入驻,覆盖了100多个应用场景,智能体生态已然初具规模。

在无数个细分领域,随着各行各业对于生成式AI的理解不断加深,基于闭源小模型的智能体,也将为行业增效发挥巨大作用。企业多数重复琐碎的工作,将会被“超级能干”的智能体所替代,人类大脑深处的潜能,将会投入到更具创造性的工作中去。

而这,就是“超级能干”的大模型应用落地的价值内核:一方面,让普通人以更小的成本,去了解和使用大模型和AI应用;另一方面,企业也能在不断的AI应用中,了解模型使用的具体场景,以及能带来的实际价值。