AI 如何赋能短影像渠道?品牌代言攻略
这是快手技术 AI 技术副总裁郑文在促销上的演讲主题。从纯粹用于制作、转发 GIF 图的工具性使用,到如今变成日活跃使用者量过亿,使用者日均使用时长超一小时的新型短影像小区,这是快手七年走过的创业路。
七年,快手使用者累计亮相短影像超过 70 亿条,从搞笑、幽默,游戏、本周最适合读的一句话:怦然心动娱乐,到各地风土、民情,信息各异。针对快手,不少人觉得它只是一家短影像企业,短影像渠道跟 AI 技术的关系并不大。
但是,如何将每位使用者的注意力高效分配给海量丰富的短影像,而非集中在少数爆款之上,光靠人工管理的方法是不可行的,这必须经由AI技术来做到。
AI 技术让记录日常更有趣

面对每日数以千万的新增影像,该如何将其精准匹配到使用者眼前?快手 CEO 宿华曾形容,这是好好生活就是胜利快手职员需要面对的前所未有的难题。为此,快手提出了一整套基于 AI 技术的解决计划,贯穿影像生产、信息理解,使用者理解,操控系统分发等使用快手的每个环节。在极客雇主交流会实地,快手技术 AI 技术副总裁郑文说,AI 是快手连接信息生产与消费两个端口的核心能力。
快手启动了一批爆款视效,像是叫做快手时光机的「变老」表情,可以在十几秒钟中,让影像中人物的容颜变成 60 年之后、还有可以实时开展肢体确认的舞蹈游戏、AR 换脸等等。何炅近况这些玩法背后是快手对前沿 AI 技术的开发,关乎人体姿态估计、手势确认、背景分割等多个技术模块。这是在信息生产领域,快手奋斗将记录形式变得更为有趣的新使用。
使用者经由快手 app 取景、上传了一段短影像后,后台机器会提取其内含的基础信息,诸如影像中人脸的性别、表情、颜值等,使用理解影像信息。机器还会依照场景确认、物体跟踪、图像品质评估等维度,对图像开展分类。语音确认,也是机器理解影像的重大方面。机器会把语音转化成文字,经由文字理解影像表达的含义。快手多传媒信息理解(Multi-Media Understanding)部门运用 AI 技术经由感知和推理两个阶段来确认一个影像,先是感知获取影像的客观信息信息,进而推理获取影像的高层语义信息。
像人把学到的知识存到大脑一样,我们把快手的信息整理并存储到快手知识图谱中,这样融合感知信息和知识图谱,就可以达成对影像高层语义及情感的确认。
促使机器理解使用者本身同样不可或缺。使用者年龄、性别、是否使用 WiFi 等开户的基础信息,使用者在使用快手时形成的众多行为资料,都将传输到一个深度进修的模型中用于机器训练,从而得到一组综合性的使用者信息,以预测使用者的喜好,个体使用者之间的关联。
快手如何破除“信息茧房”?

让记录形式更有趣,让机器理解影像信息、深度洞悉使用者,这是快手运用 AI 技术赋能短影像渠道的试探。
快手技术 AI 技术副总裁郑文说,身为前沿技术,AI在开发、执行过程中还没有一个相当成行的流程。依据自身进展状况,快手以难题为导向开展 AI 项目,先是明确需求,接着针对需求开展预研、收集资料、训练模型,之后才是相应的特性开发与商品化。
AI与算力推荐曾引发一些风波,大众普遍觉得,智能算力依据使用者兴趣推荐信息,久而久之,使用者便会被自己关心的事物围绕,失去对外部全球的整体认知,形成「信息茧房」。对此,郑文举例快手的推荐机制作答:快手的推荐给使用者的信息,绝非仅仅使用者最感兴趣的若干,而是会考虑到信息的多样性,在更广阔的领域察觉感兴趣的信息。
郑文举例说,比如在小区中,会有一些跟你较为相似但不完全一样的使用者,那么他们喜欢的信息,你也有或许会感兴趣,这样就不是使用者自己一个人去探索,而是成千上万相似但各异的人在一起探索。基于这个逻辑的分发操控系统,也可以真正顾及到长尾影像,让更多的人被看见。
身为记录载体,短影像形态本身具备普惠性。它极大下降了信息交流门槛,经由技术赋能,让人们可以公平、有趣地记录与转发日常。在极客雇主的交流会实地,郑文说,记录日常能够提升人们的美满感,在快手,人们可以目睹更丰富的全球,而他们自己也能够被全球看见。
本年四月,快手还与清华联合兴办了前方传媒资料探究院。该院以清华使用学院与快手的技术难题攻关为基础,联合资讯学院、民间学系等开展民间人文领域探究,关乎计算机图形学、图像处理、大资料和AI等领域,以兴办启动的姿态,探索技术赋能短影像的更多或许。