伴随着略显诡异的配乐,镜头扫向一个房间:几排桌子整齐地摆放着数十台电脑,屏幕上是各种主播正在卖货。此时,几行大字啪啪啪打出:“太吓人了,200平方米直播基地空无一人,全是AI数字人直播……”可仔细一看,这些主播的长相又似乎跟真人无异。
最近,你在微博、小红书,以及各大短视频平台上,是否刷到过类似视频?有人真诚发问:真人主播要失业了?也有人感慨,这是人类运用技术打造“入侵真实的仿象”又一案例。
这种现在频频现身直播间的AI主播,名叫“2D超写实数字人”。直白点讲,就是真人主播的“嘴替”。随着人工智能概念近期的火爆,他们也被营销公司包装成能替代真人主播的带货小能手。
(资料图片仅供参考)
数字人涌进直播间
数字人并不新鲜,洛天依、柳夜熙等都红极一时;带货也非初次试水,各种虚拟偶像此前早就参与过。而眼下这波正在风头上的数字人,有点不一样。
他们的形象更接近于普通人,如果不仔细看画面,会误以为就是真人。目前,这些AI主播主要出现在本地生活团购的直播间,引导用户购买各种团购券,也有少数会售卖零食、快消品等标品,以单纯的讲解为主。
当有用户进入直播间,他们可能会念出网名并表示欢迎;除了介绍商品,还可以简单回答弹幕区的问题进行“互动”。
按照提供此类技术服务的公司的说法,这些2D超写实数字人主播,“以真人为基础1∶1数字复刻而成的模型,和真人的形象、表情、声音几乎一模一样”。
“我们熟悉的虚拟偶像,主要靠穿戴动作捕捉设备的‘中之人’(操纵数字人进行直播的人),而2D超写实数字人走的是另一种技术路径。”在杭州从事数字人行业四五年的阿文解释,“整个过程简单点讲,就是你事先拍一段三五分钟的视频,一般在绿幕前,可以加上一些常用手势;通过技术训练,根据你的视频生成数字人;后续每次有需要时,只要给一段文案或者音频,数字人就会基于之前的视频,替换嘴型部分,而表情、手势等,依然是你的原视频,所以看起来一模一样。”
就现阶段来说,这些数字人主播普遍还没到炉火纯青的地步。看得久了,就会发现他们的动作是重复的,车轱辘话也是说了一圈又一圈;有些抠图痕迹明显,偶尔还会出现音画不同步。看出端倪的网友好奇地在弹幕区发问:“主播是真人吗?”
便宜但未必好用
但2D超写实数字人主播有一大优势,就是:便宜。
向业内人士请教了一下,一位小商家如果从零开始,想要搭建一个最简单的真人直播间,头一个月开销保守估计在5万元以上,后续每个月的支出可能也要两三万元。
相比之下,2D数字人可以365天7×24小时不间断吆喝带货,还不需要交五险一金,卖出的货不拿提成。场地成本同样省了,想要什么背景,动手直接在电脑上替换。
有需求的地方,就有商机。眼下,市面上已经出现了不少提供此类数字人相关服务的公司。比如南京一家有名的数字人公司,一个数字人主播定制费用为8000元,一年系统使用费8万多元。
其中广州的一位代理商坦言,单个2D数字人单场直播下来,GMV(网站成交金额)可能并不算高。他展示的其中一个烤肉团购券案例,每分钟在线人数11人,人均观看时长39秒,千次观看成交金额886元,商品点击率6%。“优势是在于提供多种形象,一段音频可生成多个不同数字人直播视频,轻松搭建直播矩阵。”
而杭州一家公司的业务助理表示,2D超写实数字人在本地生活中小商家中用得比较多,还可以用于海外TikTok、Youtube、亚马逊等平台的内容创作。他说春节前后杭州一家旅游公司就采购了10个数字人,卖出了大量旅游线路。
“直播这个事呢,我觉得2D数字人还真代替不了真人主播。”Simon是上海一家直播机构的运营负责人,多次来杭州做直播活动,也和这边数字人相关业务的公司有过接触,但终因体验感不达预期而作罢。
“真人主播的不可替代性,主要在于情感联结、互动沟通这块,可以提升粉丝黏性、提供情绪价值。短期看,2D数字人主播做不到这些。”
“此外,直播平台有自己的一套算法机制,如果一直用数字人直播,不会分发太大流量。”在Simon看来,定制一个精致的数字人主播也需要一定投入,但现阶段综合来看,产出可能不一定和投入成正比。
抖音:发布者应对AI生成内容作显著标识
眼下在直播中使用数字人,也存在一定风险。
5月9日,抖音发布关于人工智能生成内容的平台规范暨行业倡议。其中提到,创作者、主播、用户、商家、广告主等平台生态参与者,在抖音应用生成式人工智能技术时,发布者应对人工智能生成内容进行显著标识,帮助其他用户区分虚拟与现实,特别是易混淆场景;虚拟人需在平台进行注册,虚拟人技术使用者需实名认证;禁止利用生成式人工智能技术创作、发布侵权内容,包括但不限于肖像权、知识产权等。一经发现,平台将严格处罚。
记者也向快手客服做了相关咨询。对方一再表示,建议直播时真人出镜,如果检测出或者被举报“非真人直播”,很可能会被封号;不过,当数字人用于短视频发布,那么平台一般就看内容是否合规。