分类筛选
分类筛选:

关于协同论文范文资料 与我国学术数据库协同过滤资源推荐现状有关论文参考文献

版权:原创标记原创 主题:协同范文 科目:本科论文 2024-02-03

《我国学术数据库协同过滤资源推荐现状》:本论文为免费优秀的关于协同论文范文资料,可用于相关论文写作参考。

[摘 要] 通过分析2003年至2016年中国知网发表的“图书情报和数字图书馆”领域关于协同过滤推荐的82篇文献,总结我国学术数据库协同过滤资源推荐的研究现状.通过对文献样本进行分类,发现目前该领域的研究重点主要集中于对学术数据库协同过滤推荐的推廣和对推荐算法本身的完善两个方面,且后者主要集中于对数据稀疏性问题和可扩展性问题的解决.通过进一步分析,发现国内研究人员主要通过结合基于内容的推荐、空值填补和推荐结果融合三种方法缓解数据稀疏性问题;通过聚类的方法缓解可扩展性问题.

[关键词] 学术数据库 协同过滤 资源推荐

[中图分类号] G230 [文献标识码] A [文章编号] 1009-5853 (2017) 04-0011-05

The Literature Review of Collaborative Filtering Recommendation in Chinese Academic Databases

Sun Mengting Yuan Xiaoqun

(School of Information Management, Wuhan University, Wuhan, 430072)

[Abstract] By studying 82 papers published in the CNKI from 2003 to 2016 on collaborative filtering of Information and Digital Library, we investigate the hottest topics of current and history on collaborative filtering of Information and Digital Library. By classifying these papers, we discover that domestic researchers are engaged in either propagating the collaborative filtering technique in academic databases or improving the algorithm, in which the main problems are data sparseness and extensibility. By analyzing the papers further, we discover that researchers prefer to combine the content-based recommend technique, custom data or different recommend results to solve the data sparseness problem, and turn to the clustering technique to solve the problem of extensibility.

[Key words] Academic database Collaborative filtering Information recommendation

1 引 言

近年来,学术资源数据库出版的信息数量呈几何增长,“信息超载”[1]现象越来越严重,“以用户为中心”的互联网理念要求出版商从不同的角度挖掘用户的显性及隐性需求,为用户提供个性化信息服务,节约用户的信息搜索成本.因此,如何利用互联网技术高效精准地为用户提供个性化信息服务,成为目前学术出版领域的研究重点之一.其中,协同过滤推荐技术就是解决这一问题的有效方法之一.近10年来,研究人员对如何完善协同过滤推荐技术以及如何将其应用于学术数据库展开了大量工作,但相应的文献总结较少.因此,本文通过分析2003年至2016中国知网发表的“图书情报和数字图书馆”领域关于协同过滤推荐的82篇文献,对我国学术数据库协同过滤资源推荐研究进行详细调研,旨在总结目前我国学术数据库出版协同过滤资源推荐的研究情况和研究重点,厘清学术数据库协同过滤的研究脉络,为后续研究提供参考,以促进我国学术数据库个性化信息服务的可持续发展.

2 协同过滤推荐

2.1 协同过滤概念

协同过滤推荐是目前最常见的推荐技术之一,广泛应用于电子商务、电影网站、音乐社区等领域.“协同过滤”这一概念首先由戈德堡(Goldberg)等人提出[2],它基于如下假设:如果用户对某些项目的评分相近,那么他们对其他项目的评分也会相近[3].传统的协同过滤推荐分为3个步骤:(1)建立用户-项目评分矩阵;(2)寻找相似邻;(3)对用户未访问的信息项目进行评分预测并产生推荐,预测和推荐的主要特征是[4]:(1)推荐的内容是相似用户喜欢的项目,而非和用户历史偏好相似的项目;(2)计算的是用户的相似度,而非推荐内容的相似性;(3)一个纯粹的协同过滤系统并不分析所推荐项目的内容本身.显然,和其他的个性化推荐技术相比,协同过滤通过抓取用户之间的社会化联系进行推荐,不仅适应互联网时代人际联系日益增强的趋势,还回避了对领域知识、非结构化推荐项目等复杂因素的分析.这使得协同过滤推荐具有如下优势:(1)可以发掘用户的潜在需求;(2)适用范围广,无需考虑被推荐项目的内容;(3)回避了对复杂因素的分析,易于实现.

但由于只考虑人和人之间的相互推荐,协同过滤也存在如下缺陷:(1)数据稀疏性:用户评分的项目数量过少导致用户-项目评分矩阵的极度稀疏,对相似度的计算造成极大干扰;(2)冷启动:新用户进入推荐系统后,由于其尚未和系统产生交互,系统无法获取偏好数据而导致推荐功能失效;(3)数据空间的可扩展性:系统的原始数据中除性别、年龄等数据的维度较小,其他如浏览、*、点击等系统交互行为数据的维度都较大,对算法的运行效率和存储空间提出了挑战.

协同论文参考资料:

期刊协同采编系统

结论:我国学术数据库协同过滤资源推荐现状为大学硕士与本科协同毕业论文开题报告范文和相关优秀学术职称论文参考文献资料下载,关于免费教你怎么写俄语字母:Э方面论文范文。

和你相关的