首页 > 资讯
什么是数字人
理源智能物联平台、目标检测和深度学习2024-10-09

  据艾媒咨询,2025年中国虚拟人市场规模预计达480.6亿元,用户群体主要为中型及小微型企业,产品需求量TOP5分别是电商、卫生、社会保障和社会福利业、教育、金融和运输业,主要产品类型为数字员工及定制化数字人。

  一、什么是数字人

  1.1 概念介绍

  数字人是指以数字形式存在于数字空间中,具有拟人或真人的外貌、行为和特点的虚拟人物,也称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术 主要包括计算机图形学、动作捕捉、图像渲染、AI等。数字人可以打造更完美的人设,为品牌带来正向价值。互联网、金融、电商平台、消费品牌、汽车出行等领 域纷纷推出数字人,用于品牌营销、智能客服等方向。

  1.2 发展历程

  虚拟数字人

  国内发展

  1.3 特点

  1.4数字人产业链

  当前虚拟数字人理论和技术日益成熟,应用范围不断扩大,产业正在逐步形成、不断丰富,目前已经发展出了由技术层、平台层、应用层组成的产业链结构。

  上游技术层为虚拟人的生产制作提供技术支持,主要可分为硬件部分和软件部分。

  硬件包括所有虚拟人呈现及交互所需的硬件,如显示设备、芯片和交互所用的光学器件、传感器等,以及制作虚拟人时需要承载算力的计算设备、动作捕捉所用的各类光学器件以及动作传感器等。

  软件端除了呈现和交互软件外,在制作环节还需要建模软件和渲染引擎;基础层的厂商主要在海外,已深耕行业多年并形成了较为深厚的技术壁垒。

  中游平台层将上游中各独立技术进行串联,应用在具体的项目设计中,主要包括建模、动捕、渲染等制作环节。平台层公司目前在高速发展中,竞争壁垒主要在如何结合技术能力和文化设计能力,为下游应用层提供整合的虚拟人解决方案。随着AI、算法、5G网络等技术发展,制作环节成本仍有下降空间。

  下游应用层将虚拟人应用于各行业领域。虚拟人相关技术首先在影视、传媒和游戏领域有了多年应用的积累,随着技术进一步成熟正逐步呈现出新的赋能方式。

  目前在金融、文旅等领域,虚拟人凭借其与AI技术的结合,以及成本、表现力优势逐步开始提供数字员工、虚拟导游等服务。

  1.5 市场规模预测

  二、核心技术

  2.1 基本架构和制作环节

  数字人系统一般由人物形象、语音生成、动画生成、音视频合成显示、交互这五个模块组成。

  虚拟人制作流程中最为核心、最具挑战的是建模、驱动、渲染三大流程。

  建模环节:以真人为模型或设计人物为虚拟数字人建立基本的3D模型。3D 建模为构建虚拟人形象的基础,重点在于实现细节的精细还原。

  驱动环节:通过真人动作捕捉(真人驱动型)、训练驱动模型(算法驱动型)等形式确定虚拟数字人的基本动作。

  渲染环节:根据在设计环节中确定的虚拟人最终呈现效果和应用场景等外界要素,将模型与其运动进行渲染以呈现最佳效果。渲染技术用于提升虚拟人的逼真程度,实时互动亦需要实现实时渲染。

  2.2 核心技术

  虚拟数字人的三大基本特征:具备人的外观、人的行为、人的思想;基于大量技术栈的支撑,涉及硬件设备和软件算法众多领域:图形识别、视觉技术、3D建模、CG渲染、动作捕捉、人工智能、计算机语音技术、自然语言处理等。


  2.3 数字人分类

  数字人可以按照不同维度进行分类:

  根据人物图形资源的维度,数字人可分为2D和3D两大类,从外形上又可分为2D真人、2D卡通、3D卡通、3D风格化、3D写实、3D超写实、3D高保真等多种。

  根据技术驱动的维度,可分为真人驱动和AI驱动两种。

  根据商业和功能维度,可分为内容/IP型、功能服务型和虚拟分身等三种。

  从交互角度来看,根据其存在性,数字人可分为交互型数字人和非交互型数字人。

  非交互型数字人:系统依据目标文本生成对应的人物语音及动画,并合成音视频呈现给用户。

  交互型数字人:根据驱动方式的不同,可分为智能驱动型和真人驱动型。

  智能驱动型数字人:通过智能系统自动读取并解析识别外界输入信息,根据解析结果决策数字人后续的输出文本,驱动人物模型生成相应的语音与动作来使数字人跟用户互动。这种人物模型是预先通过AI技术训练得到,可通过文本驱动生成语音和对应动画,业内将此模型称为TTSA(Text To Speech & Animation)人物模型。

  真人驱动型数字人:真人根据视频监控系统传来的用户视频,与用户实时语音,同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上,从而与用户进行交互。

  从应用角度来看,数字人可分为:服务型数字人、身份型数字人。

  服务型数字人具有功能性,可以取代真人进行服务,完成内容生产和一些简单的工作,降低现有服务型行业的成本。代表应用场景是数字主播、数字老师。

  身份型数字人具有身份性,主要是虚拟的IP或者偶像呈现,可以为未来的虚拟化世界提供核心交互中介。代表应用场景是数字偶像。

  目前,通过调研分析市场上的数字人,根据人物图形维度分为2D和3D两大类,从外形上可分为卡通、写实等风格,综合来看可分为二次元、3D卡通、3D超写实三种类型。

  三、应用场景

  影视行业:数字替身特效可以帮助导演实现拍摄中无法表现的内容和效果,已成为特效商业大片拍摄中的重要技术手段和卖点。角色有数字替身。

  新闻媒体:定制虚拟主持人/主播/偶像,支持从音频/文本内容一键生成视频,实现节目内容快速、自动化生产,打造品牌专属 IP 形象,实现观众互动,优化观看体验。角色包括虚拟主持人、虚拟主播、虚拟偶像。

  游戏领域:越来越真实的数字人游戏角色让玩家代入感更强,可玩性也变得更强。角色具有数字角色。

  金融领域:通过智能理财顾问、智能客服等角色,实现以客户为中心、智能高效的人性化服务。角色有智能客服、理财顾问。

  文旅旅游:博物馆、科技馆、主题公园、名人故居等虚拟小剧场、虚拟导游、虚拟解说员。角色有虚拟导游、虚拟解说员。

  医学教育:通过数字人,可以将专家医生的大量知识、教育培训内容快速生成并产出,比图文更加生动形象,不再枯燥乏味。将知识带到千家万户的同时,也能让医生、老师从繁忙的工作中解放出来,大大节省人工成本。角色有虚拟导师、虚拟医生。

  政府单位:公安、交警、消防、法制、民政、税务、社保、食品安全、卫生等单位的宣传部都有短视频宣传知识需求。角色有虚拟叙述者。

  本地生活:解决线下商家直播成本高、不了解运营、不了解直播的痛点,数字人直播解决方案可以帮助本地商家降本增效,无需真人出镜,让本地生活直播平民化。角色有虚拟主播。

  此外,它还可以用于下列多种场景:

  四、用户群体

  中型和小微型企业为主,以华南华东区域为主,行业主要集中在电商、社会保障、教育、金融、交通运输,购买产品多为数字员工、自定义数字人和数字名人。蛀牙目的以提升工作效率和质量、提升企业数字化程度以及提升企业形象为主。

  合作模式

  用户画像

  购买产品

  使用目的

  用户诉求

  客户关注维度


  五、盈利模式

案例1:虚拟偶像的商业变现模式

  虚拟偶像是当前国内各大互联网平台争相打造的虚拟数字人形象,相比真实偶像,虚拟偶像具有确定性强、无负面新闻、“永不塌房”的特点,未来将对真人偶像产生一定冲击。目前国内的虚拟偶像的商业变现以直播带货、打赏及代言为主流。

  收入端:目前虚拟偶像创造的收入主要来自营销端(代言、直播带货等)、形象端(商演、直播打赏、影视剧参演等)、声音端(歌曲、MV发售)、衍生品(游戏、动画、手办模型等)。

  成本端:根据蓝色光标的《元宇宙营销工作手册》,当前技术水平下设计一个虚拟偶像形象花费10-100万元,且后续的内容制作和智能驱动研发还需持续投入,动态虚拟数字人直播或者视频制作的数据/渲染等对技术/算力要求较高。

  此外优秀的原创内容是虚拟偶像的主要竞争壁垒,如果拥有专业运营团队支持,运营人力成本较高。以虚拟偶像短频产品来看,一条普通的短视频成本大约在几千元甚至上万元,数分钟的定制视频的成本则需要花费数万元乃至十几万元。

案例 2:虚拟偶像核心在于IP运营

  在全民娱乐时代,文学、动漫、影视、游戏、综艺节目等娱乐形式不再孤立发展,优质的虚拟偶像IP需要体系化运营,即通过多渠道、多形式的协同合作,共同打造一个优质IP,构建大文娱产业新生态。同时,这种各业态的打通使得每一个虚拟IP都可以衍生出众多的新内容,有利于虚拟谁人产业的内容丰富化。以原创虚拟IP“翎”为例,出道获得了娱乐、科技、海内外主流媒体的关注,是首个登上央视综艺《华彩少年》的虚拟人,微博粉丝已有40余万,与奈雪的茶、特斯拉、太平鸟乐町、KEEP、天梭、100年润发、百盛等实现跨界合作。

  六、标杆企业



  soulmachines

  华院计算



  最底层是虚拟人的形象技术支撑,包括形象、语音、视觉中枢,旨在实现文本合成语音,语音驱动虚拟人口型的同步。当然平台也支持针对虚拟人形象的选择,包括 2D、3D、以及基于真人形象的采集训练还原,同时对虚拟人参数的各种可配置化功能,比如支持服装、颜色、姿势、 声音、肢体动作等参数的可配置化。

  中间层是虚拟人的“大脑”,也是平台赋能部分。基于拓尔思自主可控的NLP 技术和在众多领域落地的经验,虚拟人可以被赋予很多场景应用和特定角色,例如,泛行业垂直领域的智能问答,媒体行业内容自动创作及播报等。目前虚拟人 SaaS 服务平台已正式上线,且推出了虚拟主播、虚拟直播、直播问答这三种形式的虚拟人服务。平台通过虚拟人制作的一站式服务,使得从选“人”到成片成为流程闭环,为用户的操作提供了最大便捷。

  七、竞争格局

  1.海外巨头聚焦于虚拟数字人的基础建设。虚拟数字人产业链的基础层主要是技术壁垒深厚的海外巨头,典型代表如英伟达、EpicGames、Unity均基于自身技术优势向下游生产技术服务平台延伸。

  2.国内领先企业更多的是自研AI系统并探索虚拟数字人在社交活动、新闻媒体、文旅等领域的应用,不断涌现大量新锐企业。从区域布局来看,我国数字人代表企业主要集中在北京、广东、浙江、上海等经济和科技性产业较为发达的地区。

  3.国内虚拟数字人领域的头部玩家主要是基于已有的动作捕捉、3D建模、渲染、AI算法等相关技术,在已有业务的基础上逐步切入该赛道,如百度、阿里、腾讯、网易、科大讯飞、搜狗等综合类技术大厂。

  4.AI算法、CG类企业以及部分硬件设备厂商通过算法自研、软件开发,也在积极进入娱乐、传媒等相关领域。

  5.运营型厂商的核心业务是虚拟数字人IP及数字资产运营,相关布局厂商包括上海禾年、动图宇宙、次世文化、乐华娱乐、燃麦科技等。技术服务厂商有中科深智、万像文化、魔珐科技等。虚拟数字产业链参与玩家还包括芒果超媒、蓝色光标、风语筑、视觉中国、海天瑞声等各环节厂商。我国虚拟数字人赛道未来的玩家生态可能会更加丰富,具体所在的业务领域与入局方式将和公司的核心竞争力高度相关,头部玩家和中小规模的参与者差异将日益明显。

  八、发展趋势

  8.1 趋势发展

  随着技术的越来越成熟,以及硬件设备(移动手机、硬件大屏等)性能越来越强大,大众对于数字人的期望也会变的越来越高。

  趋势1:数字人制造和运营服务的B端市场不断扩大,将面向更广大的C端用户提供服务,各类数字人价值定位和商业模式有差异。

  趋势2:技术集综合迭代驱动数字人形似人,制作效能将继续提升。

  趋势3:AI技术驱动数字人多模态交互更神似人,并逐步覆盖数字人全流程。

  趋势4:数字人技术与SLAM、3D交互、体积视频、空间音频等技术深度融合,渲染将从本地到云端。

  趋势5:千行千面的数字人将成为人机交互新入口,但深度上仍需挖掘。

  趋势6:UGC数字人将加速出现,成为未来产业的增量空间。

  趋势7:数字人仍以2D显示设备为主,3D显示设备成为特定领域的新解法。

  趋势8:在场是数字人发展的高级阶段,将与应用场景深度耦合。

  趋势9:艺术和技术双轮驱动,北京有望成为产业新高地。

  趋势10:数字人版权保护及行业合规体系需同步建设,推动实现可用、可靠、可知、可控。

  8.2 存在问题

  虚拟数字人行业当前依然处于培育期。

  一是缺少上下游协作交流平台,制约整体产业化发展。虚拟数字人产业链长,参与主体多,既有大型平台企业、也有中小单位和初创公司,行业沟通成本高。

  二是行业投资回报周期较长,为数字人产业投资竖立了“无形壁垒”。虚拟数字人产业还不完全成熟,投资回报周期较传统技术应用更长,缺乏长期耐心资本来扶持企业成长。由于缺乏资本力量的推动,产业规模扩张与资源整合的进程相对滞后。

  技术应用层面来看,制作方式自动化程度低、生产门槛高,关键技术还不够完全成熟。

  目前3D虚拟数字人建模依然需要大量的人工制作参与,整体制作效率相对较低,与部分应用场景快速、批量制作的需求并不匹配。

  此外,在虚拟数字人的关键技术方面,还存在实时面部表情捕捉与还原精准度不足,语音识别在强噪声干扰及远场识别等方面还很难达到实用化要求等瓶颈,需要加大研究力度以提高算法精度。

  另外,虚拟数字人技术在发展中会引发一些法律问题和伦理风险,需要提前建立相关制度进行防范。虚拟数字人带来的沉浸式体验可能会对用户的精神、心理状态带来影响,改变用户在脱离虚拟世界后的行为,存在一定伦理风险。

  尽管目前数字人的发展环境、整体情况还处于尚未成熟的起步阶段,但随着虚拟数字人技术的精进、市场价值的释放,其将更全面、更深入地融入影视、金融、文旅等各个领域,充分发挥应用价值,迸发巨大的潜力。

  九、展望

  1.产业数字化转型的重要抓手

  随着在泛娱乐、商业零售、金融服务、文旅文博、医疗健康、体育赛事等领域的纵深应用和深度融合,数字人 服务的精细化和专业化将为产业发展持续带来降本增效的价值回馈,以增进“人效”为突破口,成为产业数字 化转型的重要抓手和核心标配。

  2.企业竞争的核心“人力”资产

  AI数字人与普通CG制作的数字人不同,Ta们不单是一项隶属于企业的数字资产,而是作为重要的数字化“人力”资产,成为未来企业发展的核心竞争优势之一。AI 数字人基于“智慧的大脑”可以通过深度学习,不断 更新认知体系,进而实现“人力”资源的可持续发展,为企业创造更大价值。

  3.老龄化催生“陪伴型”数字人需求

  社会老龄化不仅带来了人口红利锐减,老龄化自身也伴随着老年群体的精神孤独感,以及引发的一系列心理 或生理病症。我国上海一项调查发现,60 ~ 70 岁的老年人群有孤独感的占 1 / 3 左右,80 岁以上者约占 60%。社会老龄化也在催生对“陪伴型”AI 数字人的需求,尤其是社会大量存在的独居、失独老人,通过 AI 数字人的“陪伴”来帮助缓解精神孤独感,改善老龄化趋势下而伴生的社会问题。

  4.开发平台“在线化”(DHaaS) 是趋势

  Digital Human as a Service(DHaaS)的在线开发平台将成为 PUGC 的“创新工具箱”,赋能 AI 数字人的生成、 驱动、智能、运营“全链路”生产运营流程,共享丰富的素材库、知识库、内容库,通过“乐高化”的简易操 作,帮助大幅降低数字人的应用门槛和使用成本,覆盖长尾 UGC 用户和中小型企业用户快速拥有一条属于自 己的“数字人生产线”,第一时间从平台上享受到全球领先科技红利的同时,实现 AI 数字人使用自由。

  5.未来虚实融合世界的基本组成

  随着人工智能、虚拟现实等相关技术的逐步成熟,AI 数字人将成为我们与数字世界连接的重要入口,人机交互的重要媒介,与数字空间、数字资产、数字化身(Avatar)等一起构成未来虚实融合世界的基本组成。就像今天我们日常所用的智能手机一样,通过手机应用我们不仅快速建立与二维赛博空间的连接关系,也通过与手机应用交互获得了便捷的生活体验。未来我们也可以通过 AI 数字人等智能软体(AI Agent)实现与三维赛博空间的直接连接,并通过虚实交互享受更丰富、更沉浸的服务体验。

  6.数据安全和用户隐私保护仍是关键

  数字人作为数字世界的基本组成之一,同样面临数据安全和网络安全等治理挑战。尤其当数字人在生产生活中 的渗透性愈来愈高,扮演越来越重要的角色,其系统安全性将变得极为重要。此外,数字人作为人机交互媒介, 同样也会在日常应用中涉及用户隐私和伦理问题。这些都需要通过建立一系列监管和保障机制,并辅助技术手 段予以解决。

  7.高等级数字人依赖通用AI技术发展

  在一批人工智能科技企业引领下,数字人发展已经步入了 L4 等级的初期阶段,在制作效率和智力水平上都显 著得到了快速提升,可以在专业领域内替代真人解决一些具有重复性、标准化程度较高的服务性需求。但要再往更高层级进化,就需要依赖于通用人工智能技术的发展和成熟,从而能够像人类一样处理全局性、通用性问题。

  8.“云边端”协同计算支撑规模化应用

  随着 AI 数字人的应用边界逐步拓展,在各行各业应用不断深化,AI 数字人的高拟真性、高实时性及高并发性不仅对网络传输要求较高,对 AI 数字人的实时渲染和 AI 计算能力也提出了较高要求。

  一方面,通过低延时网络传输,以及云边端协同计算,进而可以降低AI 数字人规模化应用对终端硬件的性能限制,支持任一型号、 规格和性能的终端设备或系统都能够无缝接入并使用 AI 数字人;另一方面,支持AI数字人自身的数据训练和 深度学习过程中涉及到数据安全和隐私考量,也需要云边端协同部署进行保障。

  9.数字人资产确权流通促进交易市场活跃

  数字人作为数字资产形式之一,Ta 的权属关系和价值需要得到市场的认证,才能进一步促进市场交易的顺利进行。因此,基于区块链技术,针对数字人资产的确权和流通机制的建立将会十分重要。

  10.数字人市场发展将诞生一批新业态

  随着平台化基础设施的搭建和赋能,越来越多的企业将加入到数字人产业生态之中,数字人市场分工越来越细 分,围绕垂直领域多样化、精细化的应用需求,将会诞生出一大批例如数字人 AI 训练、数字人素材创作、数 字人资产管理和服务等创新型企业或创新型职业,也会进一步形成一批 B2C、B2B、C2M 式的数字人零售平 台,将新需求和新供给进行撮合和匹配。

阅读:
分享
用微信扫描二维码分享
请点击右上角分享给微信朋友或朋友圈