如何把数字生命变成“真人”？业内人士：大模型能让数字人聪明还有“灵魂“-众创网-数字赋能专家

如何把数字生命变成“真人”？业内人士：大模型能让数字人聪明还有“灵魂“

封面新闻2023-06-26

　　“赤壁之战的时候，如果有手机你会怎么使用?”“红孩儿是你和铁扇公主的孩子吗?”这不是人们在异想天开，而可能是在不远的将来，读者正在阅读《三国演义》和《西游记》的场景。

　　随着中国的“百模大战”开启场景比拼，大模型应用正从办公、教育等传统的线下场景转向元宇宙、数字人等虚拟世界，给予人类把电影《头号玩家》《黑客帝国》所描绘内容变为现实的期待。大模型和数字人技术的结合情况怎样?能否赋予数字人以人情味?普通人什么时候又才能拥有专属的虚拟助手?

　　“现在的大模型智商已经非常高，甚至具备了角色代入和情绪模拟的能力，”近日，360集团副总裁梁志辉在接受记者采访时表示，大模型利用千亿级别的涌现能力，就能够仅通过特定知识库补充数据后，不需要预训练，便可以将专属模型应用或数字人构建出来。“不过目前还远远没到达情商的级别。”

　　360集团副总裁梁志辉

　　更具个性化

　　以人为本是发展趋势

　　自今年3月百度推出文心一言以来，国内科技圈掀起大模型浪潮。随着阿里通义千问、360智脑、科大讯飞星火、腾讯MaaS等大模型解决方案的出现，已有超过20家企业入局大模型赛道，并推动更多行业与场景与大模型技术持续结合。千问大模型接入钉钉，星火认知大模型上线高频使用场景小助手，腾讯云TI平台打造行业大模型精选商店等现象，无不意味着在这场狂奔中，大模型的发展阶段正从通用迈入千行百业。

　　在梁志辉看来，在接下来的几个月中，还会有越来越多的行业大模型应用出现，并把拟人化代入其中。“这是一个行业的趋势，因为普通用户是不习惯跟机器打交道的。”

　　以大模型交互界面为例，这是一种类似于命令行工具，相当于人给机器输入指令，机器作出回应;这种交互模式主要是对程序员高度友好。而当AIGC和数字员工结合后，就可以通过公司的专属数据，了解到产品、品牌特征，甚至员工特有的语言表达方式，会比过去的语言大模型更具个性化。

　　大模型的交互界面

　　而要实现这一目标，关键是让“大模型+” 数字人的边际成本足够低，而训练成本在其中占据大头。以ChatGPT为例，仅模型训练阶段的总训练成本就为1200万美元，而且与训练数据呈正相关关系。当更加海量的行业数据进入大模型训练中后，是否意味着将能难实现规模经济?

　　梁志辉表示，并非所有大模型都需要预训练后才能使用。而是当数据规模达到千亿级后，大模型就会具有智能涌现的能力，即便面对没有学习训练过的内容，也只需要一段简短指令就能够在特定场景下，快速习得一种新的语言和能力来提供服务。

　　“这个理论叫做支撑架，即对大模型挂上私有数据库，从而执行非常复杂的问题。”梁志辉认为，未来，大模型供应商提供的服务主要是匹配产品，一方面通过知识库降低预训练的难度，另一方面通过数据库对大模型进行双向增强。“所以，将来的行业大模型会呈现‘一个大脑+N个本地大模型’的形态，如果面对城市就叫城市GPT，面对公司就叫公司GPT，总之就是让用户能够以可以承担的方式来用上自己需要的大模型。”

　　借助大模型

　　数字人有了人情味

　　降低使用门槛，只是行业发展的一环。将大模型具象化为一个数字人之后，还会具备哪些新的能力?

　　“除了事实性的知识，更大的突破是让数字人通过语音、表情交流能力的提升实现角色代入，从而让体验感大大提升。”梁志辉以“数字名人”为例谈到，比如，通过大模型‘支撑架’的原理，用低成本的训练方法把诸葛亮、林黛玉、孙悟空等古往今来的名人以数字化的形式构建出来，让他们与读者讨论原著图书的剧情。“这将改变人阅读的方式，让我们一边读书，一边跟数字人交流，读到特定章节的时候甚至可以提问，数字人也会基于智能涌现，将书本信息和事实性的资料融合贯通地反馈给读者。”

　　基于大模型打造的”数字人“林黛玉、诸葛亮、孙悟空

　　要提升体验感，数字人绝对不能像传统的智能客服一样，只是对特定的问题做“复读机”式的反馈，而应该是具备人情味的。但在梁志辉看来，以现阶段的技术能力，已经可以让大模型有高智商，而要让数字人变得有情商还处于探索阶段。

　　不过，目前仍有一些手段可以让数字人变得有“性格”。据介绍，通过文本学习后该人物的性格特点后，便可以通过低成本的精调把人物的情绪能力释放出来。如像林黛玉这样性格阴郁的人，询问她今天心情怎么样时，可以每次都生成一种表达心情不太好的描述;问性格急躁的孙悟空“红孩儿是不是你和铁扇公主生的时”，孙悟空会根据特定环境和上下文骂人。

　　在梁志辉看来，大模型的文本学习已经到了瓶颈期，从技术路线上看，文本学习到达千亿级后就要陆续把代码、论文，甚至音视频、语音等内容加入其中，进行多模态的训练，才能给大模型增加更多的能力。“其中，更加有效的则是通过网友打标签这类人工反馈来增强引擎，因为光靠静态的数据训练很难不断突破，而通过真人动态反馈给大模型的学习效果更好。”

阅读：