设计 owllook 网络小说推荐系统

最新推荐文章于 2024-08-09 07:26:27 发布

冰阔落

最新推荐文章于 2024-08-09 07:26:27 发布

阅读量4.5k

点赞数 2

分类专栏：推荐系统

原文链接：https://fuxuemingzhu.blog.csdn.net/article/details/87898718

版权

推荐系统专栏收录该内容

40 篇文章 4 订阅

订阅专栏

本文使用推荐算法包括：基于用户的协同过滤（UserCF）、基于物品的协同过滤（ItemCF）、基于流行度的推荐、随机推荐、基于用户标签相似度的推荐等算法。通过对比发现基于用户标签相似度的推荐算法表现效果最佳，目前已经将该算法在线上使用。

owllook

数据

本文的数据主要是用户收藏的小说、小说的类型两大类。其中用户收藏的小说这个数据比较有说服力，相对于搜索和点击记录，收藏数据更能显现出用户对这个小说的喜爱。

在我使用的这批数据中，共有用户2420个，共有书籍1596本，所有用户共收藏书籍4780本。为了验证推荐系统的有效性，我们使用每个用户的70%的数据当做训练集，把剩下的30%当做测试集。也就是说基本上每个用户都会在训练集和测试集同时出现，但是这个用户读过的书不会同时出现。我们的目的就是通过分析这个用户读过的书（训练集），去给这个用户推荐他可能感兴趣的书籍。如果我们推荐的书籍中包括了用户测试集的书，说明我们这个推荐命中了。这里的推荐没有考虑时间因素。

每本书都会有至少一个标签，比如《文化入侵异世界》这本书的标签是“科幻、时空穿梭、二次元”，这个标签是起点中文网给打的，可以认为比较准确。

下面是对用户收藏的书籍的个数统计，横坐标代表收藏个数，纵坐标代表该收藏个数有多少人。可以看出大部分人都只收藏了很少的书籍，符合长尾效应。

下面是对每本书被收藏次数统计，横坐标代表被收藏次数，纵坐标代表该被收藏次数有多少本。可以看出大部分书都只被收藏了很少次，只有少部分书被大量收藏，符合长尾效应。

评价指标

本文采用的评价指标和《推荐系统实践》一致，分为精确率，召回率，覆盖率和新颖度。

精确率描述最终的推荐列表中有多少比例是发生过的用户—物品评分记录；
召回率描述有多少比例的用户—物品评分记录包含在最终的推荐列表中；
覆盖率反映了推荐算法发掘长尾的能力，覆盖率越高，说明推荐算法越能够将长尾中的物品推荐给用户；
新颖度反映了推荐列表中物品的平均流行度。如果推荐出的物品都很热门，说明推荐的新颖度较低，否则说明推荐结果比较新颖。

算法对比

在上面的几节内容中，我们已经分析了本文的主要几个算法的工作原理，推荐系统的评价指标。真正地推荐过程分为4步：

构造训练集和预测集
训练推荐系统模型
给出推荐结果
评价推荐结果

所以我一共实现了5种推荐算法：

UserCF，基于用户的协同过滤算法
ItemCF，基于物品的协同过滤算法
Random，随机推荐
Most Popular，推荐最流行物品
Most Similar，根据用户标签相似度推荐

推荐算法\评测指标	Precision	Recall	Coverage	Popularity
UserCF	0.49%	4.93%	45.69%	1.1230
ItemCF	0.08%	0.08%	52.77%	0.6141
Random	0.04%	0.34%	99.83%	0.8827
Most Popular	0.74%	7.45%	0.90%	3.5024
Most Similar	1.43%	14.08%	7.96%	2.2894

推荐算法\评测指标	Precision	Recall	Coverage	Popularity
UserCF	0.28%	5.50%	59.08%	0.8878
ItemCF	0.08%	1.48%	62.53%	0.5854
Random	0.02%	0.36%	100.00%	0.8739
Most Popular	0.65%	12.65%	1.57%	3.2299
Most Similar	0.87%	17.52%	15.33%	2.1372

推荐解释

这里说的推荐解释，是给我们一个直观上的感受：我们的推荐结果是有说服力的。对于我们的基于用户标签相似度的推荐算法，可解释性非常强，因为我们只要证明推荐的结果书籍的标签是用户喜欢的标签即可。我们把推荐书籍的个数设为10，推荐书籍的同时打印出这个书籍的标签。

对于用户s********，他喜欢的标签是幻想修仙和仙侠，推荐的这10本书基本比较符合，同时也推荐了两本玄幻的书籍，相当于去探索用户的其他兴趣。

User: s********
User tags: {'幻想修仙', '仙侠'}
User books: ['系统的超级宗门', '明朝败家子', '兔子必须死', '我真是医二代', '万界之最强大', '听说我死后超凶', '神豪的悠闲人生', '创业吧学霸大人', '这个末世有点槽', '逆天邪神']
recommend for userid = s********:
一念永恒 ['仙侠', '幻想修仙']
飞剑问道 ['仙侠', '古典仙侠']
圣墟 ['玄幻', '东方玄幻']
牧神记 ['玄幻', '东方玄幻']
道君 ['仙侠', '幻想修仙']
凡人修仙传 ['仙侠', '幻想修仙']
剑来 ['武侠仙侠']
斗战狂潮 ['仙侠', '修真文明']
蛊真人 ['仙侠', '幻想修仙']
大王饶命 ['都市', '都市生活', '二次元']
['一念永恒', '飞剑问道', '圣墟', '牧神记', '道君', '凡人修仙传', '剑来', '斗战狂潮', '蛊真人', '大王饶命']

对于用户陈**，他喜欢的书籍标签是科幻和二次元，看出推荐的书籍都是比较接近他的口味的。

User: 陈**
User tags: {'未来世界', '史诗奇幻', '奇幻', '科幻', '时空穿梭', '二次元'}
User books: ['放开那个女巫', '两界搬运工', '修真四万年']
recommend for userid = 陈**:
大王饶命 ['都市', '都市生活', '二次元']
诡秘之主 ['玄幻', '异世大陆', '二次元']
修真聊天群 ['都市', '异术超能', '二次元']
修真四万年 ['科幻', '未来世界']
赘婿 ['历史', '架空历史']
学霸的黑科技系统 ['科幻', '超级科技']
牧神记 ['玄幻', '东方玄幻']
异常生物见闻录 ['科幻', '时空穿梭', '二次元']
天道图书馆 ['玄幻', '异世大陆']
['大王饶命', '诡秘之主', '修真聊天群', '修真四万年', '赘婿', '学霸的黑科技系统', '牧神记', '异常生物见闻录', '大医凌然', '天道图书馆']

对于用户风**，他喜欢的标签是历史和武侠，这个推荐的书籍非常符合他的口味。

User: 风**
User tags: {'清史民国', '传统武侠', '两宋元明', '历史', '历史军事', '架空历史', '武侠'}
User books: ['刺明', '明扬天下', '草清', '三国之兵临天下', '顺明', '指南录', '纸花船', '明贼', '乱世扬明', '明末传奇', '大明1617', '大明最后一个太子', '汉儿不为奴']
recommend for userid = 风**:
赘婿 ['历史', '架空历史']
汉乡 ['历史', '架空历史']
唐砖 ['历史', '两晋隋唐']
带着仓库到大明 ['历史', '两宋元明']
剑来 ['武侠仙侠']
秦吏 ['历史', '上古先秦']
锦衣夜行 ['历史', '两宋元明']
圣墟 ['玄幻', '东方玄幻']
晚明 ['历史', '两宋元明']
['赘婿', '汉乡', '唐砖', '带着仓库到大明', '剑来', '秦吏', '锦衣夜行', '明朝败家子', '圣墟', '晚明']

当然，也存在一些口味比较复杂的用户，收藏了很多种类的书籍，推荐的结果也应该包括了对应的种类。比如对于用户青**，推荐的结果留给读者自行判断吧。

User: 青**
User tags: {'游戏异界', '二次元', '恐怖惊悚', '史诗奇幻', '灵异', '都市', '古典仙侠', '东方玄幻', '进化变异', '修真文明', '异世大陆', '都市生活', '灵异鬼怪', '幻想修仙', '黑暗幻想', '奇幻', '科幻', '游戏', '玄幻', '仙侠'}
User books: ['怪谈研究会', '就是个道士', '最初的寻道者', '恶神当道', '我是仙凡', '道辟九霄', '当个法师闹革命', '炼道长生', '一世之尊', '问镜', '原始战记', '极度尸寒', '恐怖邮差', '玄门封神', '封仙', '蛊真人', '这世界的土著好凶猛', '诸天纪', '仙路云霄', '旧日篇章', '深夜书屋', '修真新时代', '白中仙的修道生涯', '侠道行', '道门振兴系统', '难道我是神', '我假装会异能', '我当道士那些年', '绿洲中的领主', '与妖怪的二三事', '道吟', '氪金魔主', '一品修仙', '全球高武', '黑夜玩家', '民国谍影']
recommend for userid = 青**:
圣墟 ['玄幻', '东方玄幻']
飞剑问道 ['仙侠', '古典仙侠']
牧神记 ['玄幻', '东方玄幻']
一念永恒 ['仙侠', '幻想修仙']
大王饶命 ['都市', '都市生活', '二次元']
剑来 ['武侠仙侠']
斗战狂潮 ['仙侠', '修真文明']
太初 ['玄幻', '东方玄幻']
逆天邪神 ['仙侠', '幻想修仙']
道君 ['仙侠', '幻想修仙']
['圣墟', '飞剑问道', '牧神记', '一念永恒', '大王饶命', '剑来', '斗战狂潮', '太初', '逆天邪神', '道君']