从元宵节AI做画,到高考季度晓晓的高分作文;从百度APP对话式搜索,到龚俊数字虚拟人的聊天……今年以来,百度文心大模型频频创造社会热点,AI已经离我们越来越近了。
这不是错觉,AI正在我们每个人的工作、生活中潜移默化、润物无声地渗透。这背后,是大模型加速落地、开启价值阶段的转折点。
「 01 」
场景“大爆炸” 度晓晓“出圈”
今年的高考季,数字人度晓晓“出圈”了。
每年的高考作文都会成为公众的一大关注点。今年语文考试结束后,百度数字人度晓晓化身为“数字人考生”,挑战高考作文写作——《本手、妙手、俗手》这篇议论文,在40秒内就创作了40多篇文章,平均1秒生成1篇。
不仅速度快,文章结构还非常完整,论述逻辑清晰、文字语言流畅,文中还大量引用了名人名言,并使用了排比、比喻等修辞手法。面对高考作文写作“审题”、“逻辑”和“创意”等挑战,度晓晓在文心大模型的帮助指导下,又快又好地完成了写作。
曾担任北京高考语文阅卷组组长的申怡,为度晓晓的作文打出了48分的成绩(满分60分),这一分数已经超过75%的高考考生。
作为一个数字人,度晓晓不仅能答题,还能变身学习助理,为考生提供虚拟服务,包括整合多模态交互技术、3D数字人建模、机器翻译、语音识别、自然语言理解等多项技术能力,可以在查分、报志愿、查录取等重要高考节点推送提醒,确保考生和家长不会错过任何重要信息,还能根据考生的不同特点,智能推送个性化的报考推荐和优质内容。
另外,“度晓晓”还能与考生进行智能聊天对话,通过情感陪伴的方式帮助用户缓解压力与情绪波动,全程陪伴考生及家长。
在百度文心大模型的加持下,度晓晓的角色还可以从高三考生秒变AI艺术生,带着她的画作“现身”西安美术学院的2022年“时空留痕·无界西美”本科毕业展。在其展出的用AI创作的六幅绘画作品中,除了四幅与“无界”主题强相关的作品(《自然与虚拟》、《火星上的月亮》、《沙漠中的孤岛》、《颜色与星空》)外,还有两幅有关西安大雁塔的特别作品。度晓晓仅用数十秒就完成了作品,而且“已经达到了本科美术毕业生的基本要求”。
拥有一个智慧的灵魂——文心大模型,度晓晓可以分饰多个角色,可以跟据场景换不同的造型,也可以换个合适的名字。
在百度自己的智能化产品中,语音搜索、信息推荐、对话系统、智能音箱、自动驾驶等方面都得到了实践。比如在百度App端内的AI数字人,目前主要可以实现四大功能:即个性化聊天陪伴、辅助搜索、服务分发和互动玩法。
在外部,文心大模型已落地工业、能源、金融、通信、媒体等领域,通过飞桨开源开放平台、百度智能云等赋能到各行各业,个人、企业开发者数量超6万。
随着“度晓晓”一次次出圈,你才突然发现AI已经遍地开花。
在AI遍地开花的同时,其价值也在不断被验证:在媒体行业,可以激发创新,提升内容多样性,降低制作成本;在保险领域,能够让文本处理效率提升30倍;在人力资源应用中,候选人信息智能分类识别准确率可高达99%;在医疗领域应用中,病历检查时间从30分钟缩短到了秒级……
一项技术的快速普及,其要素之一就是广泛的应用场景,并且能在场景中产生价值。从过去这两年文心大模型落地的应用来看,场景正在不断丰富,尤其是今年呈现出“大爆炸”之势,与此同时应用价值也逐渐被用户认可。此次度晓晓出圈,也让更多人看到了AI的价值,无疑将对AI的普及起到进一步催化作用。
「 02 」
技术成熟,文心大模型已是“优秀生”
预训练大模型在AI进程中为什么重要?它如同AI“轮子”,解决场景碎片化的难题,是AI从作坊式变成工厂式生产的通用工具。所以,大模型在一定程度上也决定着AI落地的速度。
所谓预训练大模型,是通过自监督学习的方法,让模型对海量无标注数据中的规律和知识进行提炼、学习,当面向实际任务和场景应用时,只需要少量的任务标注数据,就能通过持续微调得到在应用场景中非常好用的模型。从这一点可以看到,其特点就是通用性强、泛化性强,易用且好用。也正是因此,全球科技巨头都在预训练大模型领域投入研发力量,展开“军备竞赛”。
百度是中国企业中走得早、走得快的科技企业之一。2019年3月,百度率先发布国内首个正式开放的预训练模型ERNIE 1.0,那个时候这项技术还相对稚嫩。此后两年两次升级,到2021年7月,百度百亿参数规模的知识增强型预训练模型ERNIE 3.0 问世,这是当时业界首次在百亿级预训练模型中引入大规模知识图谱。
ERNIE 3.0 一举刷新了54个中文NLP任务基准,其英文模型在国际权威的复杂语言理解任务评测SuperGLUE上,以超越人类水平0.8个百分点的成绩登顶全球榜首,处于全球领先地位。当年12月,百度联合鹏城实验室打造了“鹏城-百度·文心”(代号ERNIE 3.0 Titan),这是全球首个知识增强千亿大模型,参数规模达到了2600亿,是当时全球最大中文的单体模型。就在刚刚结束的WAVE SUMMIT 2022深度学习开发者峰会上,文心大模型又迎来一系列重大升级——ERNIE 3.0 Zeus成为融合了任务相关知识的千亿大模型,也是国内首个开放API调用的千亿大模型。
文心大模型的一大特色是“知识增强”,即引入知识图谱,将数据与知识融合,使得学习效率更高、可解释性更好。今天,用AI进行创作已经很成熟,从财经、体育类新闻快讯,再到诗歌、小说等文学创作,AI写作覆盖的领域越来越广,创作形式和内容也变得更加丰富多彩。
这次支持度晓晓完成高考作文的,就是文心大模型最新发布的融合任务相关知识的千亿大模型ERNIE 3.0 Zeus。这一模型在学习海量数据和知识的基础上,进一步学习了百余种不同形式的任务知识,增强了模型的效果,在各类NLP任务上都表现出更强大的零样本和小样本学习能力。
技术的成熟度,是市场普及的另一个关键因素。短短几年时间,百度文心大模型已经成为业界的优秀生。随着技术的成熟,只需要少量的任务标注数据,就能通过持续微调得到在应用场景中非常好用的模型,进一步加速在各类场景中的应用落地。
以AI创作的一些例子来分析,在文心大模型的支持下,利用AI自动生成内容的新型生产方式——AIGC已经渗透到诸多场景中,并且愈发成熟:AI作画、AI写歌、AI剪辑、虚拟主持、智能客服……根据百度研究院预测,2022年AIGC技术将借助大模型的跨模态综合技术能力,实现更为规模化的应用。
对此《经济学人》最近发表的一篇关于大模型的文章也指出,文心ERNIE大模型是中国最好的预训练大模型,“AIGC的普及,能够给人类的创作带来更多灵感。”
「 03 」
搭桥铺路,由点到面加速普及
基于技术成熟、场景价值的基础,AI普及的第三个要素就是实现路径。
在今年WAVE SUMMIT 2022深度学习开发者峰会上,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜认为,今年是大模型的落地关键年,她对此强调:“要做好落地,需要解决的关键问题,是前沿的大模型技术如何与真实场景的方方面面要求相匹配。”实际上,就是要在技术与场景之间搭桥铺路,让技术快速在场景中落地。
首先是模型体系。不同场景对模型的需求会有一定的差异化,所以在通用模型的基础上要增加不同特质,对此百度增加了两类模型:一是任务大模型,主要面向特定任务,比如语音搜索、图文搜索、图象理解等等;二是行业大模型,针对特定行业进行知识增强后的大模型,百度当前的模型体系中已经发布能源和金融两个行业大模型,未来还将不断更新更多行业。
将大模型体系化,按技能、行业细化,拓宽了人工智能技术落地场景的覆盖广度。如果用盖房子来比喻,大模型就是基础设施,有人建公寓,有人建别墅,有人建写字楼,有人建厂房,有人建商场。不同的建筑,选择不同的基础设施。
其次是全流程支持。百度今年WAVE SUMMIT 2022发布了大模型开发套件、API和内置了文心大模型能力的EasyDL及BML开发平台。
所谓全流程支持,本质上是降低了技术渗透到产业应用的难度,提升了落地速度。如果用盖房子来比喻,这就相当于提供各种工具、图纸以及施工指导,帮助你快速完成工程。
比如,高性能部署方案涵盖了通用蒸馏、任务蒸馏、模型裁剪等大规模轻量化落地方案,以及飞桨算子融合、模型量化等加速方案。再比如,预设多领域的丰富任务,包括40多种NLP任务,涵盖了分类、抽取、检索、生成等;20多种计算机视觉任务,涵盖了人脸、人体、车辆、商品、食物等细粒度分类识别。在这些预制任务下,方案提供配置文件、命令行等多种启动方式、实现一键组网训练。
最后是生态、社区。任何一项技术的普及,都与生态的繁荣度密切相关。大模型的技术成熟了,未来如何创新地应用于场景中,需要更多的开发者共同探索与创造。百度开放的大模型创意和探索社区——旸谷,是文心大模型支持下的一个创意应用空间,也是开发者尽情展现自己“脑洞”的地方。百花齐放、百家争鸣,将会加速世界向AI迁移的进程。
我们都知道,生态能促进场景应用的丰富度。如果类比于盖房子,生态就是各种设计师、建筑师在这里发挥创意,出设计图、建样板间,他们在实现自我价值的同时也可以供别人参考、复制。
可以说,今年度晓晓的“出圈”,让更多人深刻感受到了AI的发展已经到达一个临界点:这将是由点到面快速普及的一年。广度、速度、丰富度,百度有意识地在多个维度加速AI的落地,今年我们将在更多的场景中看到AI带来的创新价值。
【结束语】
正是因为大模型的重要性,过去几年间,业界展开了大模型的技术军备竞赛,大家不停刷榜。事实上,无论大模型的性能有多强、参数量有多么庞大,最终的价值体现是要落地,好用、易用的同时,还要在应用场景中产生价值,带动产业发展和升级。文心大模型完成了初期的技术积累,率先开启了大模型的价值阶段。