AI 似乎正在让这个世界以一种前所未有的方式提速。

5 月 23 日,百度在深圳文心大模型技术交流会上宣布了一个阶段性成果:

文心一言在企业服务高频场景下的推理性能提升 50 倍。

虽然大家可能已经对 AI 的各种进化看腻了,但不要小瞧这样的性能提升。因为无论是海外的 ChatGPT还是文心一言,都只是预训练语言大模型的应用罢了,大模型还有巨量的其他应用形式( 下文会展开 ),甚至现在业界有很大的声音认为,AI 大模型强大的通用能力或许会把包括互联网、工业、金融、教育、政务等各行各业的产业链条都“重塑升级”一次。

并且,这样的观点并不像近些年的元宇宙和区块链概念一样“雷声大雨点小”,可以看到,最先拥有大模型能力的厂商已经动起来用 AI 大模型加持自己家的产品了。

在海外,Salesforce、Snap、Quizlet、Instacart、Shopify、Speak 等企业都已经接入了 OpenAI 的功能,OpenAI 的大金主微软更是恨不得把自己家的产品从头到脚都灌满 AI 创造出各种衍生应用。

而在国内,已经有 15 万家企业申请接入百度文心一言,有超过 300 家生态合作伙伴,一起探索了超 400 个具体的落地场景。据百度智能云副总裁朱勇透露,早在 2019 年文心大模型发布后,百度就在搜索、推荐、地图、小度等产品上应用了文心大模型。百度将在所有业务中都集成文心一言的能力,内部做了非常详细的规划。

那么,AI 大模型的应用到底会对企业有多少提升、有什么样的提升呢?

我们以百度为例,它也像微软一样,拿自家的大模型在自家的业务上先下手,已经验证了大模型在不同业务上的实用性。

通过文心大模型的能力接入,百度搜索的问题分类准确率提升了 4.5%,新闻去重召回率提升了 8%,百度地图的信息搜索满意度提高了 6%,内部 OA 应用如流上的活动方案撰写效率提升了 30%,旗下智能硬件品牌小度的意图理解准确率提升了 3.1% 。

其实,关于大模型赋能企业或机构的实际例子还可以有很多,离生活远一点说,5 月初百度凭借 mRNA 序列优化 AI 算法登上了《 Nature 》正刊,这个技术让新冠 mRNA 疫苗的效果( 抗体反应 )最多提升了 128 倍,因为 mRNA 的排列组合跟大语言模型中文字的排列组合机制有些像,大模型的思路可以直接复用过去。这个应用如果能在制药公司和科研机构上广泛使用,未来是可以造福全人类的。

而离生活近一点,连电商客服这种场景也可以被 AI 大模型 “ 重塑升级 ”。知危编辑部曾找到国内某 TOP 3 客服外包集团进行过了解,该集团正在测试大模型在在线客服上的应用,他们告诉知危编辑部:

现阶段他们测试认为大模型应用于在线客服潜在能够节省约 90% 的人力。

相应地,百度在 5 月 23 日这场技术交流会上也提到了大模型赋能客服产业可以大幅降低企业成本。百度算了一笔让人觉得不可思议的账:一个客服一天大概要对接 300 个客户,每天要回复六万多字,企业成本是 100 到 200 元,但如果选择用文心大模型的客服能力之后,成本将只需要 1 元钱。

除了降低成本,大模型还可以非常高地提高企业内部的效率。在技术交流会上,百度官宣了百度网盘基于文心大模型的全面升级,其中企业版升级了三大应用:“ 智能文件管理 ”,“ 内部知识库 ” 和 “ 多模态加工 ”。网盘可以帮助企业自动给办公文件打上标签分类整理,并且能理解和归纳总结企业内部的知识,同时还能线上对图片进行 AI 加工,这样就大大地提高了企业内部文件流转、处理以及对内部知识梳理与利用的效率。

此外,大模型应用还能潜在地改变很多行业,23 日的技术交流会上,百度智能云 AI 应用产品部总经理刘倩介绍了百度智能云 6 大 AI 应用的全面升级。举了非常多的例子,我们在此截取一些给大家展示。

在政务方面,大模型可以非常好的提高民众们办理政务业务的体验。政务服务助手基于文心一言的能力,可通过简单对话的方式完成办理流程。文心大模型可以更加精准地理解民众咨询意图和政策术语,解决了口语对话和政务术语之间的鸿沟,并且通过构建线上办事大厅,缩短了民众办事路径,让办事不再难。

金融行业方面,可以应用的场景也是非常多的。比如做投资研究时,需要处理大量的公司以及产业数据和新闻,这单纯靠人工整理效率是非常低的,那么有一个能自动归集整理数据、辅助生成观点的大模型应用就很重要。

而在电商或者更广义的 “ 营销 ” 方面,大模型的多模态能力也潜在有着大量的应用,比如自动生成文案、稿件、产品图等等,相信大家已经看到过一系列例子了,不仅如此,现在大模型甚至还可以做到一键开启数字人直播带货了。

以百度文心大模型为例,它可以做到音色、视频、直播话术、控场话术、营销话术、弹幕回答话术完全都由模型生成的程度,据刘倩透露,数字人主播的转化率,是过去流行的 “ 无人直播 ” 的 2 倍以上。

更多的例子,不胜枚举,所以理论上来讲,企业在自己业务的各处使用大模型是一个必然趋势。

那么,问题就来了:谁来向企业提供大模型相关的服务?

答案是有大模型技术实力的云服务公司。

2022 年 5 月,OpenAI 还不为大众所熟知时,微软就已经把 OpenAI 服务上架到了自己的云服务产品 Azure 上开卖了。他们的这个举动,显然已经意识到了企业对大模型相关服务将有非常旺盛的需求。

无独有偶,三周前的五四青年节,百度创始人李彦宏在百度公司发表了一段内部演讲。他提到:

“大模型是 Game Changer,它会彻底改变云计算的游戏规则”。

他解释道,过去,云计算主要卖算力、看速度、看存储,今天,客户购买云服务,会看框架好不好、模型好不好,而不是仅仅看算力怎么样。

那么,什么是好的大模型云服务呢?

我们以百度为例阐述,李彦宏说上面那些话的一个多月前,百度就已经开始内测了面向企业的“文心千帆” 。文心千帆并不是某个具体的 AI 大模型产品,而是一个一站式大模型平台,可以帮助企业在开发大模型应用过程中的全生命周期提供服务。

百度之所以能像微软一样很快地推出文心千帆这样的企业大模型服务平台,很大的一个原因是因为它是全球唯一一个有芯片、框架、模型、应用四层架构全栈布局的企业。从昆仑芯片、飞桨深度学习平台、文心大模型到应用均拥有关键自研技术,十分完备,一致性也很强,可以做到四层端到端的优化,最大程度的发挥各层的效能。这也是为什么短短两个多月的时间文心一言在高频场景下的推理性能能提升 50 倍的原因。

这么说可能有点抽象,我们展开解释一下,一个 AI 应用的诞生有非常重要的四层,第一层是提供算力的芯片,第二层是能合理利用算力并把数据有效转化成模型的框架,第三层是训练好的模型,第四层是对模型进行微调或定制后形成的应用。这四层过程中,哪个环节出了问题,都会对效率产生影响。比如,框架不合理只能发挥出芯片 60% 的算力性能、框架不合理导致训练的模型无法有效收敛变成可用度较高的模型等等,这对争分夺秒搞智能化的企业来讲,是非常致命的。

所以,大模型云服务平台的完备性、一致性、端到端的优化能力是非常重要的。在这条硬标准上,目前百度体现出了绝对的领先优势。两个月前,李彦宏曾公开表示:“百度是全球唯一在人工智能四层架构有全栈布局的公司,且四层当中每一层都有比较领先的产品。”

同时,大模型平台的易用性,也是非常重要的。

在 23 日的交流会上,有一个有趣的演示。一个咨询公司的创始人,分享了他们的一个应用思路:过去,在咨询过程中他们经常需要讲故事,也经常需要帮助客户来讲故事,他们积累了非常非常海量的故事数据,但却没办法完全有效的利用,因为故事的内容实在是太多了,他们自己都无法记住所有故事,而文心千帆,让他看到了一个高效利用故事素材的希望。

作为一个丝毫不懂代码的人,他只要上传一些分类好的故事素材,很快就可以训练出一个效果还不错的“故事大脑”模型,凭借这个模型,他不仅能快速搜索到故事,还可以快速生成符合企业需求的优质好故事。

上传的故事

生成的模型的效果

从图片的内容上看,你可能会产生疑惑:这人做出来的这东西,跟文心一言有什么区别?文心一言不也能生成故事吗?

实际上,这是他在为自己定制一个模型的过程,文心一言虽然会讲故事,但讲的未必是他想要的有针对性的故事,所以,他凭借文心千帆这个“模型工厂,生产出了一个更定制化,更符合企业需求的讲故事大模型,而这个过程,一行代码都不需要。

过去,云服务平台都在强调低代码,现在百度直接可以零代码生成简单的模型了,易用性非常高。

当然,这个时候你就会发现,如果使用文心千帆的大模型平台服务,企业在某些场景下会输入自己的内部资料,那么这些资料安全吗?所以平台好不好,安全性也是一个比较重要的考量。

这方面,百度智能云在公有云服务上,有完善的指令监控、日志监控、审核以及资源隔离机制,可以保证数据安全,并且对于模型和数据有私有化部署需求的客户来说,还可以选择私有化部署的方式。而在另一个纬度的“安全”上,也就是模型输入输出内容的“内容安全”方面,百度基于几十年的搜索引擎经验,有非常庞大的关键词库,可以有效过滤掉输入和输出环节中存在异常的内容。

在5月23日的交流会上,百度智能云AI与大数据平台总经理忻舟表示,很多企业发现自己在使用友商生成式 AI 产品的过程中提交的问题或者内部代码,过两天就被用到模型的基础数据上去了。但百度,一定不会这样做。因为数据是用户的隐私,百度不会拿用户数据做模型训练和迭代优化。在符合政策要求的情况下,这些数据会被删除。

此外,对于大模型平台来讲,开放性,也是非常重要的。

在开放度方面,百度文心千帆也可以说是开放到头了,无论芯片、框架、模型还是应用,这四层都可以由企业自主选择,无需每一层都用百度的产品。比如你用百度算力的同时使用 OpenAI 模型,也是完全没问题的。文心千帆照样可以帮你实现模型的调优、开发和部署。就有点它每个环节都很强,不怕你不用的意思。

最后,由于企业的需求和 IT 水平非常多样,大模型平台服务的灵活性也很重要。在文心千帆上,你可以选择公有云服务和私有化部署。公有云服务方面,支持推理( 直接调用通用大模型输出结果 )、微调( 在通用大模型的基础上根据需求注入数据微调 )、托管( 把所有工作都交给百度,企业直接用现成的 )。私有化部署方面,百度可以授权大模型所需要的服务、也可以提供交付相关硬件的服务,如果企业觉得直接采买硬件没那么划算,还支持租赁服务。

其中文心千帆的租赁服务非常有意思,客户在实际应用大模型时,有很多场景对于数据的训练、模型的训练是没有那么高频的,可能半年或者一年训练一次就行,但是训练的硬件成本非常高,并且又有一定的私有化需求,这样就会给企业造成比较大的负担。针对这种情况,文心千帆提供了租赁的方式,可以把服务器通过邮寄或者是开集装箱卡车的方式,运输到企业里,接入企业内网,去完成低频的训练,等训练完成就把设备拉走,或者把车开走。这可以让企业实现非常低成本、非常高效的模型训练。

你看,应用还都没开始大规模落地,百度就先把平台工具全都搭好了,这说明百度跟微软一样,作为大模型的第一梯队,都在用实际行动押注 AI 大模型应用的未来。

在 AI 从“辨别式”走向“生成式”的现在,企业的思路都将转变为“智能化”优先,各种各样你想象不到的潜在应用场景都会指数级的飙升,这就意味着大模型平台服务必须要向自来水一样唾手可得,让企业得以便捷高效地不断做应用创新。

而百度,似乎就是那个供水的自来水厂。

特此声明
本文为正观号作者或机构在正观新闻上传并发布,仅代表该作者或机构观点,不代表正观新闻的观点和立场,正观新闻仅提供信息发布平台。
分享至

还没有评论,快来抢沙发吧!