首页 > 资讯
如何把数字生命变成“真人”?业内人士:大模型能让数字人聪明还有“灵魂“
封面新闻2023-06-26

  “赤壁之战的时候,如果有手机你会怎么使用?”“红孩儿是你和铁扇公主的孩子吗?”这不是人们在异想天开,而可能是在不远的将来,读者正在阅读《三国演义》和《西游记》的场景。

  随着中国的“百模大战”开启场景比拼,大模型应用正从办公、教育等传统的线下场景转向元宇宙、数字人等虚拟世界,给予人类把电影《头号玩家》《黑客帝国》所描绘内容变为现实的期待。大模型和数字人技术的结合情况怎样?能否赋予数字人以人情味?普通人什么时候又才能拥有专属的虚拟助手?

  “现在的大模型智商已经非常高,甚至具备了角色代入和情绪模拟的能力,”近日,360集团副总裁梁志辉在接受记者采访时表示,大模型利用千亿级别的涌现能力,就能够仅通过特定知识库补充数据后,不需要预训练,便可以将专属模型应用或数字人构建出来。“不过目前还远远没到达情商的级别。”

  360集团副总裁梁志辉
 

  更具个性化

  以人为本是发展趋势

  自今年3月百度推出文心一言以来,国内科技圈掀起大模型浪潮。随着阿里通义千问、360智脑、科大讯飞星火、腾讯MaaS等大模型解决方案的出现,已有超过20家企业入局大模型赛道,并推动更多行业与场景与大模型技术持续结合。千问大模型接入钉钉,星火认知大模型上线高频使用场景小助手,腾讯云TI平台打造行业大模型精选商店等现象,无不意味着在这场狂奔中,大模型的发展阶段正从通用迈入千行百业。

  在梁志辉看来,在接下来的几个月中,还会有越来越多的行业大模型应用出现,并把拟人化代入其中。“这是一个行业的趋势,因为普通用户是不习惯跟机器打交道的。”

  以大模型交互界面为例,这是一种类似于命令行工具,相当于人给机器输入指令,机器作出回应;这种交互模式主要是对程序员高度友好。而当AIGC和数字员工结合后,就可以通过公司的专属数据,了解到产品、品牌特征,甚至员工特有的语言表达方式,会比过去的语言大模型更具个性化。

  大模型的交互界面

  而要实现这一目标,关键是让“大模型+” 数字人的边际成本足够低,而训练成本在其中占据大头。以ChatGPT为例,仅模型训练阶段的总训练成本就为1200万美元,而且与训练数据呈正相关关系。当更加海量的行业数据进入大模型训练中后,是否意味着将能难实现规模经济?

  梁志辉表示,并非所有大模型都需要预训练后才能使用。而是当数据规模达到千亿级后,大模型就会具有智能涌现的能力,即便面对没有学习训练过的内容,也只需要一段简短指令就能够在特定场景下,快速习得一种新的语言和能力来提供服务。

  “这个理论叫做支撑架,即对大模型挂上私有数据库,从而执行非常复杂的问题。”梁志辉认为,未来,大模型供应商提供的服务主要是匹配产品,一方面通过知识库降低预训练的难度,另一方面通过数据库对大模型进行双向增强。“所以,将来的行业大模型会呈现‘一个大脑+N个本地大模型’的形态,如果面对城市就叫城市GPT,面对公司就叫公司GPT,总之就是让用户能够以可以承担的方式来用上自己需要的大模型。”

  借助大模型

  数字人有了人情味

  降低使用门槛,只是行业发展的一环。将大模型具象化为一个数字人之后,还会具备哪些新的能力?

  “除了事实性的知识,更大的突破是让数字人通过语音、表情交流能力的提升实现角色代入,从而让体验感大大提升。”梁志辉以“数字名人”为例谈到,比如,通过大模型‘支撑架’的原理,用低成本的训练方法把诸葛亮、林黛玉、孙悟空等古往今来的名人以数字化的形式构建出来,让他们与读者讨论原著图书的剧情。“这将改变人阅读的方式,让我们一边读书,一边跟数字人交流,读到特定章节的时候甚至可以提问,数字人也会基于智能涌现,将书本信息和事实性的资料融合贯通地反馈给读者。”

  基于大模型打造的”数字人“林黛玉、诸葛亮、孙悟空

  要提升体验感,数字人绝对不能像传统的智能客服一样,只是对特定的问题做“复读机”式的反馈,而应该是具备人情味的。但在梁志辉看来,以现阶段的技术能力,已经可以让大模型有高智商,而要让数字人变得有情商还处于探索阶段。

  不过,目前仍有一些手段可以让数字人变得有“性格”。据介绍,通过文本学习后该人物的性格特点后,便可以通过低成本的精调把人物的情绪能力释放出来。如像林黛玉这样性格阴郁的人,询问她今天心情怎么样时,可以每次都生成一种表达心情不太好的描述;问性格急躁的孙悟空“红孩儿是不是你和铁扇公主生的时”,孙悟空会根据特定环境和上下文骂人。

  在梁志辉看来,大模型的文本学习已经到了瓶颈期,从技术路线上看,文本学习到达千亿级后就要陆续把代码、论文,甚至音视频、语音等内容加入其中,进行多模态的训练,才能给大模型增加更多的能力。“其中,更加有效的则是通过网友打标签这类人工反馈来增强引擎,因为光靠静态的数据训练很难不断突破,而通过真人动态反馈给大模型的学习效果更好。”

阅读:
分享
用微信扫描二维码分享
请点击右上角分享给微信朋友或朋友圈