从“皮囊”到“灵魂”,周鸿祎眼中的虚拟与现实

大曼 2023-06-14 19:41

生成式AI鲜花着锦,诸多大模型争相问世,但在应用方面,仍面临着能否嵌入场景、广泛应用等问题。

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍马伯庸在著作《长安十二时辰》中有两个很有意思的设定,就是靖安司手中掌握的两件利器:一件是望楼,一件是大案牍术。

所谓望楼,即瞭望长安全城和传递消息的制高点;所谓大案牍术,则是由一个叫徐宾的人独创出来的一套算法,基于大唐卷宗、案牍所记录的各种数字,推断真相和预测未来。手握这两项技术的人,即使不是靖安司,也能摇身一变成为长安城的“解谜人”。 

而在1300多年之后的今天,站在人工智能大模型黄金十年的起点,“大唐时期的大数据技术”也拥有了新的时代定义:望楼,成为一家企业的战略思维;大案牍术,则是这家企业场景应用的直接体现。 

6月13日,三六零公司(601360.SH,下称“360”)召开360智脑大模型应用发布会,创始人周鸿祎宣布认知型通用大模型“360智脑”已正式进入到4.0时代,并已实现了生态内浏览器、搜索、安全卫士等全端产品的接入。 

与此同时,作为360 在大模型战略中的核心创新,全新发布的“有灵魂”的数字人,不仅承载了360智脑4.0强大的多模态能力,同时也被市场赋予了更大的期待,那就是成为未来人工智能大模型最重要的应用入口。 

方兴未艾,快速迭代 

在一个月前央视的《对话》栏目中,主持人向作为嘉宾的两位科技企业家王小川和周鸿祎,提出了这样一个问题: “现在是入局 GPT 的好时机吗?” 

严格意义上说,两位嘉宾都没有正面回答买一瓶酒喝很难的这个问题,而是用投入力度当作答案。王小川表示,自己团队的所有人,“都投进去了”。

周鸿祎则表示,360搜索的几百人团队和360研究院的50人团队,几乎都投向了大模型。另外,他还打趣道,“当然,也投了自己”,而“360智脑4.0”发布会上他本人形象的数字人的现场互动,也让人们真正见识到了这一点。

在周鸿祎看来,如果使用一些简单的问题进行对比,会觉得大家发布的产品都差不多,但如果真正了解GPT-4.0强大的思维链模型,就会发现其将一件事情进行连续多步推理,将一个目标做多任务分解和规划的能力非常强。

尽管此前业内主流观点认为,与GPT-4.0的这种能力相比,我国目前的大模型能力是前者六七成的水平,时间大概落后两年左右,但在此次发布会上,周鸿祎“收回”了这句话,因为在他看来,以国内同行们的发展迭代速度,已基本赶上或者接近了国际先进水平。

这类“赶超”的劲头,其实也不用看同行,如果光看360自己的发布节奏,已经足以感知到国内大模型迭代的“中国速度”——

3月29日,360智脑的1.0 Beta版本发布,彼时版本的不完善,甚至只能与360搜索结合,多轮对话尚且难以做到;

仅不到一个月时间,360在北京民生证券人工智能高峰论坛上演示了360智脑的2.0版本,彼时已经能实现多轮对话;

半个月后的天津人工智能大会上,多模态文生图的“360鸿图”得以发布,大模型版本迭代至2.5;五月底的发布的结合物联网场景的智脑视觉大模型,又把版本号迭代至3.0;

6月13日,360智脑4.0正式亮相,360 AI数字人同步发布,360智脑在多模态等关键能力上完成迭代,并将全面接入“360全家桶”。

据陆玖商业评论不完全统计,如果仅仅以官宣发布的数目来看,国产的GPT大模型数量已经接近百家,但在发布会之外,普通用户自由可用的不到三分之一,如果与360类比,能做到多模态等综合能力的,则会被压缩到5个以内。

正因如此,360的大模型在发布早期,或许还跟其他六十多个大模型一样“泯然众人”。但在数次迭代之后的“脱颖而出”,则在某种程度上佐证,在大模型这件事上,360可能在体量上难以比肩阿里、腾讯等头部玩家,但在大模型的技术水平上已经走到一线大厂的级别。

大模型的面子与底子 

在进军多模态领域之前,文字领域 “基本盘”的确保显然也在 360 的议事日程之上。也正因如此, 360 也在积极参与国内外各类 AIGC 功能评测。 

来自JioNLP大语言模型评测发布的最新测试结果显示,在5月22日的评测结果中,360智脑在通用大模型的基准评测结果中,多项能力位居国产大模型第一,整体排位也超过了百度、讯飞等科技企业。

在JioNLP看来,360智脑的表现无疑超出预期,相比其它国内模型,优势主要体现在客观题回答准确率相对较高,问答类题型准确性较好,说明模型训练的文本数据分布较广。

最值得一提的是,模型对于编程题目的准确性较高——测试题中共3道程序题目,全部答对,没有出现明显的偏离和瞎答。

但在周鸿祎看来,以目前国产大模型的激烈竞争态势,在民间机构评测中的优势也只是一时。这里他用另一家机构SuperCLUE的评测举例,因为在这家机构的测试中,360智脑的测试原本排名也处于国内第一的位置,但在最新的测试中又被“刷下来”了。

排名的一时之先,固然不能说明太多问题,但在“百模竞发”的当下,360能在民间或者官方组织的评测中数次拔得头筹,显然与公司整体对于大模型的“梭哈”有极大的相关度。

战略层面,一封在4月21日发出的内部信,足以说明360 all in大模型的决心。

在这封号召360全体拥抱人工智能的“总动员令”中,周鸿祎认为,大语言模型是场新工业革命,任何APP、软件、网站和应用都值得被重塑。GPT和百行千业的深度结合将直接改变行业竞争格局,搭不上这班车的企业就会被淘汰。

这里也与前文提及的迭代节奏同样能进行对应——360智脑在两个半月的时间内迭代至4.0的版本,如果只是一个部门间的“单打独斗”,很难拥有到目前为止的完成度。唯一能作为解释的,就是360从整体层面对大模型业务做了资源倾斜。

在倾斜的众多资源中,作为国内头部的搜索引擎厂商,海量多样及高质量的训练语料和工程化的调度能力,寻常厂商显然难以具备。2022年的财报数据同样显示,360超过86%的收入,来自互联网与智能硬件,而互联网部分,则是为人熟知的360搜索等业务。

数据层面,360搜索每天已经可以抓取超过1.4亿网站的数据,中间包括2.8亿的专业文献,1.2亿的行业数据,以及经过清洗的10T级别用于大模型训练的数据。

它也不止用于“如何用大模型提高点击率和推荐精准度”的级别。有OpenAI和微软指路在先,360如今也把以往积累的AI能力迅速移植到大模型和全端产品中。发布会当天,周鸿祎同样宣布,360智脑4.0也接入包括浏览器、安全卫士等全端产品。

要知道,现在距离初版智脑发布,仅仅过去不到3个月。速度上的“面子”倒在其次,建立在速度上的数据、安全等底层积累,同样也是重要影响因子。

弯道超车:AI数字人的场景应用 

当 “弱智吧精选 100 问”、“画一幅鱼香肉丝”等刁钻测试问题,已成为大模型发布会上的“传统艺能”,在 360 发布的智脑 4.0 版本中,图文的准确识别与理解显然不再是重点。以视频、数字人为代表的多模态生成,才是 360 突破的重点领域。 

周鸿祎认为,这也是国内大模型弯道超车的关键。

在文生视频方面,周鸿祎在现场演示了熊猫划船、企鹅在沙漠洗澡的文字生成视频。虽然从分辨率和时长两个维度来看,二者素质都不算上乘。但在国内相关领域,仍然属于从0到1的突破。

事实上,拥有可用的、成熟的多模态生成能力,以及对全部应用场景的应用覆盖,也是360把此次大模型升级定义为4.0的重要原因。

在周鸿祎看来,目前国内已然进入了“百模大战”,各个科技企业的基础能力可以说几乎差不多,像百度、腾讯、头条、阿里、360也都有自己固有的场景,大家会在自己固有的场景里把自己的AI能力赋能。

因此,比拼的关键,还是各家应用落地的能力,即如何使AI更简单、更便捷地为公众、企业所使用。

按360自己的“企业级理解”,首先是普通人能够方便地触达。此前不久,360也上线了自己的“AI商店”,旨在汇集业内主流的AI工具,让普通用户也能全面了解AI能力图谱,实现AI普惠。

另一方面,则是对此前的AI衍生行业进行再赋能与再升级。本次发布会,周鸿祎也带来了智脑4.0版本下的数字人应用。

与业内通用的数字人不同,360的数字人不用外部设备采集人体特征信息,也不用算法驱动肢体动作,在内嵌360智脑之后,数字人完全拥有了自己的“独家记忆”,也有自己的人设与性格。与此前二次元直播领域的“套皮”、“中之人”等玩法相比,显然往前又迈了一大步。

这是让市场感到更加兴奋的地带——360 AI数字人未来的发展方向是生成声音、视频并拥有长期记忆,甚至拥有目标分解和规划的能力,并且拥有“手和脚”,甚至未来很有可能出现“数字永生”,让数字人之间也可以进行自主交流。

在搭载了具备多模态生成能力的大模型之后,“无人驾驶”的数字人,已经能实现跟人类似的画图、做视频等“高难度动作”。而随着技术的不断迭代,原本千万级别的部署成本已经能“飞入寻常百姓家”。这与360长期坚持的人工智能战略不谋而合。

很显然,360的AI普惠并非“纸上谈兵”,真正的人工智能想要迎来革命性时刻,或许在模型层“内卷”毫无出路,而落地场景才是实现突围的焦点。

而在“双翼齐飞+四路齐发”的整体策略下,目前360的数字人广场平台,包含数字名人和数字员工在内已经超过200个。搭载大模型的数字员工的出现,也为原本除了“降本增效”缺乏其余场景的大模型,扩展了自己的应用边界。

卡在业内首发的时间节点,360在数字人领域和大模型的身位又再度提前。市场稀缺的属性,也让其对用户和市场的吸引力再度提升一个量级。国内大模型弯道超车的奇点不仅属于AI数字人行业,同样也属于360。