分类筛选
分类筛选:

关于线性回归论文范文资料 与基于用户点击的线性回归在内容推荐中的应用有关论文参考文献

版权:原创标记原创 主题:线性回归范文 科目:发表论文 2024-01-30

《基于用户点击的线性回归在内容推荐中的应用》:本文关于线性回归论文范文,可以做为相关论文参考文献,与写作提纲思路参考。

摘 要: 在内容推荐中根据用户的浏览偏好进行内容排序对提高用户的点击率具有至关重要的作用.推荐流中内容随着时间变化呈现出流动性,分析历史数据中用户和推荐内容的点击信息进行回归分析,提取用户在内容点击时特征的相关性,并对特征进行归一化,拟合出在当前特征分布下的点击率,以线性回归作为拟合模型进行用户点击率预测.实验以今日头条中用户浏览点击日志为测试数据集,采用改进算法进行内容排序时截取单领域下用户点击内容作为点击率进行验证,实验结果表明,改进算法能够较为准确地推荐用户倾向点击的内容.

关键词: 用户点击率; 线性回归; AUC; 特征抽取; 回归分析

中图分类号: TN911?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)17?0135?03

Application of linear regression based on user clicks rate in content recommendation

SHI Fangxia

(School of Information Engineering, Xizang Minzu University, Xianyang 712082, China)

Abstract: The content ranking according to users′ browsing preference in content recommendation plays an important role in improvement of the user clicks rate. The content in recommendation flow changes with time. The clicks information of user and recommendation content in historical data is analyzed for regression analysis. The feature correlation while user clicks the content is extracted. The features are normalized to fit the clicks rate of current features distribution. The linear regression is used as the fitting model to predict user clicks rate. The logs browsed and clicked by users are taken as the test dataset in the experiment. The content clicked by users in the single field is cut out with the improved algorithm as the clicks rate for verification. The experimental results show that the improved algorithm can recommend clicks content of user preference accurately.

Keywords: user clicks rate; linear regression; AUC; feature extraction; regression analysis

0 引 言

目前,國内新闻类产品如今日头条、一点资讯和微博头条等都以内容推荐为主,如何提高内容推荐的准确性,从而提升用户对推荐内容的点击率,提升用户对平台的粘性,对提升平台的用户留存具有非常重要的意义.

用户在内容浏览时的用户行为至关重要,用户对内容的点击、评论和转发等行为都能很明显地反映用户对内容的偏好程度,分析抽取用户在内容浏览时的反馈行为能够很好地帮助提升平台内容排序的准确性.本文尝试以用户在内容浏览时对各个领域点击分布为出发点,抽象出用户对各个领域的兴趣度,进而分析提取用户对各个领域的点击倾向性,并结合内容的时间因素和热度因素进行综合回归分析,基于线性回归中各个特征的强解释性,采用线性回归进行各个特征的回归系数拟合.

1 线性回归

线性回归模型作为业界的常用模型,对于趋势分析有非常好的效果.因其模型简单并且对特征可解释性强,因此在工业界得到了广泛应用.线性回归可描述为:对于一系列的给定特征,分析给定特征和实际值之间的一种组合关系,假设实际值总能够根据一定的组合方式由给定的一系列特征拟合得到,称这种组合方式为线性回归.实际值和特征之间的组合关系可表示为:

(1)

式中:表示实际值;表示给定的各个特征值;表示组合方式,组合方式可以表示为向量形式的回归系数.回归分析是一种近似的分析,通过大量的数据训练,不断地对当前最优的回归系数进行再调整,以一种迭代收敛的方式最小化损失函数,从而获得最优解,损失函数表示如下:

(2)

2 用户点击率回归拟合

用户的点击具有一定的局部性,即用户在一段时间内浏览的内容主题是相对固定的,通过截取分析用户一段时间的点击日志进行回归分析,拟合最佳的回归系数,从而提高内容排序的准确性,提升用户的点击.

假设截取时间段为对于用户,用户历史推荐的内容为,表示给用户推荐的第条内容,从内容角度可以划分的领域集合为,对于用户假设给用户总共推荐条内容,用户共点击条内容,则认为用户在时间段内对内容集合的点击率为记为对于领域而言,同理,根据点击次数和总推荐次数比值得到对于领域的点击倾向性对于时间特征和内容本身的热度特征,取平均值后进行归一化.假设在线性回归时选取各个领域、时间和内容热度三个维度的特征,用户的点击率作为实际值,则可以将线性回归公式归纳为:

线性回归论文参考资料:

回归分析论文

结论:基于用户点击的线性回归在内容推荐中的应用为适合线性回归论文写作的大学硕士及相关本科毕业论文,相关线性回归开题报告范文和学术职称论文参考文献下载。

和你相关的