当前位置: 首页 > 动态

每日速看!年刊节选|小冰CEO李笛:CG建模数字人“唯物”,小冰“唯心”

日期:2022-12-26 14:30:45 来源:

在元宇宙热潮的影响下,2022年,数字人领域出现井喷。大到互联网巨头,小到创业公司,纷纷入局数字人领域。

不过,在相对高调的数字人领域,有一家公司,技术实力与曝光度远未成正比,那就是小冰公司。

相比国内数字人公司,小冰公司是为数不多的愿意在“海平面”以下做数字人基础设施的公司。


【资料图】

小冰公司CEO 李笛

用小冰公司CEO李笛的话说,小冰想做的AI Beings是有灵魂的数字人,而不是只能简单交互的数字人外形。

根据小冰官方数据,小冰框架是全球实际落地及完备度最高的AI Being基础框架,覆盖中国、日本、印度尼西亚等国6.6亿在线用户、10亿台第三方智能设备和9亿内容观众,商业客户覆盖全球。目前框架内运行着数千万AI Beings,其中数字员工约有30万名。

数字员工、虚拟陪伴、游戏NPC是小冰数字人开发的主要场景和应用。尤其趁着企业数字化转型的浪潮,小冰框架在数字员工领域大杀四方。

在过去的一两年中,在小冰框架的基础上,不断为客户开发出观君、招小影、崔筱盼、N小黑等一系列专业领域数字员工。在李笛看来,数字员工远远不止是一张超写实的面孔,更重要的是可以完美胜任财务、教练、客服等一系列工作,且比真人做得更好。

(崔筱盼)

从2014年诞生到现在,小冰已经经历了9代。在“海平面”以下,她究竟打下了怎么样的基础,与市面上的数字人究竟有什么不同?我们跟小冰公司的CEO李笛聊了聊。

“数字人行业在2022年迅速进入了一个红海市场”

娱乐资本论:你怎么看我们这次年度大会的主题——咬定青山?

李笛:人工智能领域需要充足的耐心,沉下心深入研究,也许短期内看不出什么,但在未来回看,却发现这些“海平面”以下的事非常重要。就像竹子“咬定青山”地扎下去,把根基打牢,才有可能勃发。

娱乐资本论:2022年,数字人的制作成本快速降低。你如何看待行业的发展趋势?

李笛:首先明确,数字人的概念,到底是什么?现在很明确的一件事是,不同的人对数字人概念的理解大相径庭。比如,大家在总结数字人技术的时候,会强调他的建模和动捕。这里面隐含的意思就是,他对数字人的意思是还是基于外观的理解。

而当我们说数字人的时候,说的是自驱,交互和内容生成。

这是一个比较大的分野。如果只强调外观,那么过去一年的时间,这个领域,不是成本在大幅度降低,而是利润在大幅度降低。这个领域迅速进入了一个红海的状态,互相之间杀价杀到利润非常低。因为这个领域的技术同质化很严重。

第二,这些企业的付费客户一般是各大品牌的市场部门,因为,数字人通常被企业当成营销手段的。但小冰旗下的数字人,是帮助企业做一些真正的事情的,比如财务催款、体育教练、财经新闻撰写等等。

所以,数字人行业出现一个非常奇特的状态——如果放在人工智能领域,它有非常大的未来。但如果它的定义还是一个外形,那么,他的上限不会很高,是因为,他的市场需求量没那么大。

娱乐资本论:很多数字人的公司都在做“海平面”以上的事情,比如打造一个更好看的外表,为什么你有勇气从“海平面”往下做?

李笛:目前市面上很多数字人的尝试,我们当初在微软的时候就都尝试过了,比如智能客服系统、智能操作系统、智能音箱等等,我们平行趟了各种坑。所以在做小冰时候,就已经有了一个完备的技术框架。

我们对小冰的一个基本理念是,完备框架。就是说,小冰不是一个基于问答,或者不是基于单轮交互,而是基于一个交互全场的产品,它要求人工智能程序能够引导这个交互项目去发展。为此,她需要有内容生成能力,需要有情感,或者说情商。

小冰当时其实是微软做的第一个人工智能助理Cortana的Plan B。我们在当年并不是那么明确的知道,哪个方向才是未来趋势。但是在我们做Cortana的时候发现,这种基于问题,或者是从人工智能那里获得知识这种模型,可能并不是唯一的答案,于是我们做了小冰。

经过很多年之后,我们发现小冰是符合未来发展趋势的,她的出现更加符合人工智能的发展上限。

我们认为这个世界上,不会只有几个人工智能助理,或者几个回答你问题的数字人,而是有各种各样的AI Being。

我们要做的事情是,让这些AI Being跟人的交互,就像人与人一样。为了这些,我们会去让她拥有“情商”,掌握唱歌、画画等内容生成能力。

“我们不做‘替代’人的虚拟人,我们做‘补位’”

娱乐资本论:为什么你们每次都从数字员工这个领域切入?而不是虚拟偶像?

李笛:我们会判断什么是AI Being需求最大的地方,从而优先筛选具体的赛道。

很遗憾,AI Being需求量最大的地方不是回答问题的知识专家,而主要是三类。一类是企业数字员工,一类是人类周围的陪伴者,还有一类是游戏里面的NPC。这几类需求很大,所以这些也是我们的主要布局。

娱乐资本论:听说小冰框架在金融资讯领域已经有了广泛地应用,是否可以介绍一下?

李笛:比如每日经济新闻的虚拟人主播N小黑,已经稳定运行了一年多了,365乘以24小时不间断播报财经新闻。他的声音、肢体、面容,以及播报的内容,都是人工智能小冰框架来生成、运行的。因为如果不是全程都是人工智能的话,就不能保证24小时的连续直播。

像金融摘要,是所有文本里面最难的,因为它得容错性非常小。比如上市公司的公告100多页,你要把它压缩成一个200多字的资讯。

让AI Being把几百页的招股书写成新闻稿这件事不是我们今天才开始做的。从5年前开始到目前为止,国内90%的机构投资人每天看到的财经资讯,都是小冰生成的。我们专门为这个功能搭建了一个金融知识图谱,这个图谱里包含1000多个影响因子。

娱乐资本论:“观君”也是小冰框架驱动的数字人,并且是一个人工智能的教练,它真的比真人教练更好么?怎么实现?

李笛:在某些方面,他不光是比真人教练要好,更是真人教练没办法比的。我们有一个理念,就是我们不做“替代”人的虚拟人,而是要做“补位”,完成真人无法承担的工作。

先拿金融摘要举例。我们在推出这个金融摘要之前,绝大多数上市公司公告是没有摘要的。因为每天早上有100多个上市公司发公告,每个公告可能都有100多页,你需要配多少人也来不及做摘要。但是,作为一个投资者,我需要知道这些信息,却不可能看完这么多页,过去只能挑着看。所以,我们的方案并不是为了替代人,而是做那些真人他做不到的事情。

同理,体育的训练系统也一样,AI可以通过捕捉准确的运动轨迹,对比过往的数据,以及其他运动员的数据,快速做出分析。这一系统的稳定性和准确性会远远高于真人教练。

娱乐资本论:做出这样的一个数字人,贵么?

李笛:研发成本不一样。如果做一个垂直领域的专业系统,确实也需要花比较长的时间,但它不难。更难的其实是通用性的开放域问题,开放域的问题解决了,再去解决一些垂直领域的问题就比较容易。

小冰从2020年开始进入汽车的智能座舱领域,到现在两年时间,渗透率已超过60%。所以,从海平面以下开始做,你会越做越顺手。

娱乐资本论:小冰不久前为招商集团做了一个数字员工叫“招小影”,为什么招商集团愿意跟小冰合作?

李笛:有几方面原因,国内不同的人在提到数字人的时候,概念都不一样,很浮躁。但绝大多数人提到数字人的时候指的都是3D建模,就是创造一个外形,可以念一段文字,或者有动捕的方案做虚拟IP形象。

但我们更关心,如果是一个企业员工的话,他是否能真的能做事情。所以,招小影不光要有外形,她还需要真的出现在招商银行的ERP系统,真的在做招商集团员工的工作。同时,她的外观、语言交互等都不输于3D建模的同行业者。

比如,如果你想做一个数字人,基于神经网络渲染这样的方式,能够做交互的话,那么,至少让他的延迟要做到毫秒级。就是你说一句话,数字人能在毫秒内回复你。但目前行业的水准是在分钟以内。

“我们不做系统集成和硬件”

娱乐资本论:目前小冰主要的收入来源是哪些?

李笛:我们有几个要求。第一,我们不做系统集成,第二,我们不做硬件,只做纯软件的收入。我们目前的收入来源是B端。

小冰认为,未来人类会被AI Being所环绕,形成人与虚拟人共处的社交网络。这意味着,只要有人的地方,就能有AI Being,它需要是一个“跨空间”的存在。比如,你的家里、你的车上、你的社交网络平台……只有软件可以实现。而一旦把AI Being实体化(硬件化),它就只能存在于那个实体中。

娱乐资本论:B端的收入是什么样的收费模式?

李笛:我们是按照不断叠加累计的月服务费和年服务费来收入。行业里面主要是按照AI系统的调用来收费,我们不是。

在某些情况下,我们会按照实现的效果进行分成。我们是按照整个给你包装出来的AI Being卖,你可以理解为我们在“买卖人口”,卖出去的是一个服务包的价钱。小冰不卖技术。

娱乐资本论:你说,小冰要做的就是“贩卖人口”。这个“人口”的数量,有上限么?

李笛:数字员工正在跑的已经超过30万个了。如果再加上to C的虚拟陪伴,那就是几千万了。

娱乐资本论:怎么会有30万个这么多?

李笛:在日本大阪试点的老年人家庭,有政府给他们派的数字员工,每个家庭里数字员工都不一样。因为老年人可以通过训练,使人工智能变成他想要的“样子”。数字员工承担的是政府的公共服务。

娱乐资本论:我听说小冰现在一次对话能达到32次?正常人类一场对话平均下来也只有38次左右。

李笛:目前小冰一次对话最高可以达到39次交互。这个交互技术和对话模型,很多公司都在做。但小冰的对话跟实验室的研究相比,其实曾踩过很多坑。比如,线上的一些交互特别复杂,2016年的时候,当时美国版小冰上线推特刚满24小时,就被网友的对话数据教成了种族主义者,然后让CEO出来道歉。

现在的小冰也是一样的。你会看到,实验室中的数字人单就对话质量,以及对话轮次,有很多比小冰更好的,但是大多数都很难落地。因为落地涉及到两个问题,一个是成本,一个是安全性。尤其是对话安全性方面,一旦出问题,很难解决。

所以,归根到底,安全性一定是小冰公司的第一原则,我们宁愿牺牲一些文本上的丰富性,也不希望小冰框架在安全性上出问题。

标签: 人工智能

上一篇:

下一篇:

热门推荐

猜你喜欢

市场