左右互搏:GAN在爱奇艺短视频推荐冷启动中的实践一、背景

**​导语:**由于推荐系统冷启动问题的存在,在视频推荐中为用户推荐新视频是一个极具挑战的问题,新视频推荐的效果直接影响推荐系统“新陈代谢”的稳定性和内容生态的健康发展。为了解决该问题,本文主要介绍了爱奇艺随刻推荐团队在短视频推荐业务上基于对抗神经网络(GAN)的新视频冷启动的落地实践方案。

一、背景

推荐系统的冷启动问题是指当新物品或新用户进入推荐系统后,由于没有该用户或该物品的历史信息,推荐很难取得较好的效果的问题,这一问题很容易影响新用户的使用体验和用户留存,是短视频个性化推荐领域一个重要的问题。

要解决这个问题,我们首先要了解下,推荐系统的冷启动由哪些部分组成。

推荐系统的冷启动主要可以分为用户冷启动、物品冷启动和系统冷启动三类。

以用户-物品评分矩阵为例,如下图所示,在用户-物品评分二维矩阵中,用户和物品分别有冷热之分,进而形成四象限,第一象限即为物品冷启动问题。

新视频推荐在视频推荐系统中是一种典型的物品冷启动问题,对于爱奇艺在线视频服务平台,每时每刻会有大量新视频生产和上线,尤其是以UGC、PUGC为代表的短视频,同时短视频又具有快速消费和一次性消费的特征,使得新视频如何快速地准确地高效地分发给感兴趣的用户成为一个持续的研究问题。

从新视频的内容属性看,新视频相较于老视频,视频历史信息缺失,没有用户视频交互行为数据,同时视频meta属性可能有缺失或者不准确,如何准确地描述和表达新视频是第一性问题。

从新视频分发路径和周期看,新视频分发会经历少量试探性或验证性分发,通过系统验证后进入大量的自由分发阶段,如何优化新视频分发路径、如何使新视频高效触达目标靶用户是视频和用户如何建立连接的问题。

从视频推荐系统整体看,新视频推荐是推荐系统物料正常的“新陈代谢”,由于短视频具有快速消费的特征,视频推荐系统整体的物料更新速度较快,如何稳定地进行“推陈出新”是推荐系统的“开源问题”;同时新视频meta属性缺失或者不准确、推荐分发试探和验证会给推荐系统整体带来一定的开销和引入一些噪声,如何准确高效进行新视频推荐是推荐系统的效率问题。

从新视频生产供给侧看,新视频推荐分发的效果,会对视频生产创作进行前期直接的反馈,对视频生产创作者的研判决策有一定的影响,对于内容生态的健康发展具有引导和指标性作用。

因此,新视频推荐对推荐系统至关重要,如何有效地构建新视频推荐,根据第一性原则分析,需要解决两个基本问题,第一是如何表示新视频,第二是如何对新视频和用户建立连接。

首先,如何表达新视频成为解决问题的出发点。传统的解决方案,多数是基于新视频属性的内容表达,如新视频的类别、标签、创作者等;内容表达直观,但是表达的特征离散和稀疏,同时受噪声影响波动较大。第二,如何使新视频直接与用户建立连接成为解决问题的关键。传统的基于属性内容的表达,通过视频属性与用户画像属性,进一步利用相似性或相关性计算建立新视频和用户之间的联系。以上基于分离的两部框架,结构简单表达能力不足,且分离框架信息传递会有熵减,存在信息损失和误差叠加的问题。

因此,我们设计了基于对抗神经网络的新视频推荐的解决方案,基于对抗神经网络生成器产生的embedding向量化的表达所蕴含的信息更加丰富,同时神经网络拟合真实用户特征,完成新视频和用户间复杂的映射关系;对抗神经网络生成的新视频特征不仅与给定的新视频相关,而且和真实的用户特征相似,从而完成了新视频表达、新视频和用户建立映射关系二者的联合统一。

二、模型框架结构设计

在视频推荐中为用户推荐新视频是一个极具挑战的问题,为了解决该问题,本文提出了基于对抗神经网络(GAN)的新视频冷启动方案,它通过获取用户和物品之间隐含的属性级的交互信息,利用了视频属性的多个角度产生可能对该新视频感兴趣的用户特征,并基于属性级的相似度将新视频推荐给目标用户。

GAN模型的整体框架结构如下图所示:

GAN模型的网络结构由生成器和判别器两部分组成,生成器可以根据输入的视频的属性生成一个可能喜欢该物品的用户特征向量;判别器可以根据输入的用户特征-视频特征样本对,判断输入的用户特征是真实的还是生成的,筛选出与真实用户相似且与视频相关的生成的用户特征。最后从用户集中选出若干个与生成的用户特征向量最相似的用户,并将该视频推荐给这些用户,完成新视频冷启动召回。

GAN模型总的目标函数为min-max优化表达式,其期望生成器最小化目标函数,同时判别器最大化相同的目标函数,具体计算公式为:

其中D*表示判别器D, ϕ表示判别器的参数,Pture(u+|In)表示判别器D的函数;G*表示生成器G,θ表示生成器的参数,Pture(u+|In)表示生成器G的函数,N 是训练集中视频的个数。

2.1 生成器

生成器采用了多个子生成器的结构,即生成器可以分为两个部分:

第一部分:

对于视频Item候选集I={I1,I2,I3,…,In},其中每个视频Ii有k维属性A={ai1,ai2,…,aik},视频的k维属性中每个属性分别被送到特定的生成器中,然后生成潜在用户的特征;

第二部分:

神经网络G合并所有的生成的用户特征向量,通过多层全连接神经网络,输出一个最终的用户特征向量,该过程可以表示为:

生成器通过最小化目标函数训练得到最优的生成器,当在训练生成器的时候判别器的参数是固定的,只需要优化跟生成器相关的项,通过以下公式计算:

一般来说,生成器比判别器要完成的任务更难,因为生成器要进行概率密度的拟合,导致的影响GAN性能的一个问题就是模式坍塌,即生成高度相似的样本。采用多个生成器单个判别器可以有效地缓解这个问题。

2.2 判别器

判别器采用单判别器的结构,对于判别器有两种训练样本对:

一种是(u+,Ic),即给定的视频和生成的用户特征形成的样本,其中uc是生成器G生成的用户特征,Ic是视频属性的特征;另一种是(u+,Ic),即给定的视频和真实用户特征形成的样本,其中u+是在真实行为数据中对给定视频感兴趣的用户,对于真实用户的特征由真实用户画像生成。判别器的目的就是将(uc,Ic)和(u+,Ic)这两种样本区分开来,其中(u+,Ic)是正例,其标签是1;(uc,Ic)是负例,标签是0,通过以下公式计算:

判别器输出的是用户和视频相关的概率,通过以下公式计算:

其中 ϕ是判别器的参数。

在判别器网络训练时通过最大化目标函数来得到最优的判别器,通过以下公式计算:

通过以上两种样本的进行训练,可以使判别器筛选出生成器生成的用户特征不仅与真实的用户特征相似,而且和给定的视频相关。

2.3推荐生成

生成器生成了可能喜欢当前物品的用户特征之后,就可以把当前的新视频推荐给与生成的用户最相似的真实用户了。本文用余弦相似度计算的生成的用户和用户集中用户之间的相似度,采用ANN优化了相似解求解性能。

三、线上效果

该方案已于爱奇艺主APP短视频推荐系统中上线,在新视频的分发和消费方面都有显著正向的结果,对高热产生效率以及系统曝光新鲜度等方面都有极大提升:

1.新视频分发效果方面,曝光占比明显提升,视频新鲜度相对提升12.4%。

2.新视频消费效果方面,CTR相对提升11.9%,人均播放时长相对提升56.5%。

四、总结展望

以上是我们近期在爱奇艺短视频推荐业务中新视频推荐冷启动召回的方案落地,实践证明基于对抗神经网络实现的新视频冷启动解决方案,对线上新视频推荐的效果是有很大收益的。后续我们会从以下几个方面持续优化:

1. 优化多个生成器生成的属性特征融合,引入attention机制等方法,使得特征表达更加合理。

2. 采用多个判别器结构,进行不同粒度的boosting判别筛选,使得生成特征更加多样性,避免模型病态和蜕化。

参考文献

[1] Sun,Changfeng, et al. "LARA: Attribute-to-feature-adversarial learningfornew-item recommendation." Proceedings of the 13th International Conferenceon Web Search and Data Mining. 2020.

[2] Goodfellow,Ian, et al. "Generative adversarial networks." Communications of theACM 63.11 (2020): 139-144.

[3] Arjovsky,Martin, Soumith Chintala, and Léon Bottou. "Wasserstein generativeadversarial networks." International conference on machine learning. PMLR,2017.

[4] Ebesu, Travis,and Yi Fang. "Neural semantic personalized ranking for item cold-startrecommendation." Information Retrieval Journal 20.2 (2017): 109-131.

[5] Gantner,Zeno, et al. "Learning attribute-to-feature mappings for cold-startrecommendations." 2010 IEEE International Conference on Data Mining. IEEE,2010.