本文从谷歌新闻、搜狐新闻、今日头条的推荐系统,分析新闻资讯行业,推荐系统采用的主要策略。
1、谷歌新闻
Rec(article) =IF(article) ×CF(article)
IF(article)内容过滤
GoogleNews把新闻文章分类到预先定义好的话题类别中,包括国际、体育、娱乐等。
在日志分析中,根据用户的搜索和点击行为,构建贝叶斯框架,预测用户新闻事件兴趣。
CF(article)协同过滤
把用户聚类,让与这个用户有着同样兴趣的其他用户帮助完成个性化推荐的过程。
2、搜狐新闻
特色:构建了丰富的内容分类树形体系,可以反复优化,运营干预色彩重。
内容分类:标签词、主题、子频道、频道、话题、热点、地域、来源等
用户:用户分群、建立用户画像、与内容分类对应。
新闻入库:内容同步、抽取(基于正文内容特征;基于标题、摘要的关键词)。
推荐:计算新闻关键词与标签词、主题、子频道、频道的距离。
修正:根据转化率等指标、反复修正用户画像和内容分类。
3、今日头条
特色:丰富的推荐逻辑
基于相似文章主题相似性的推荐:通过获取与用户阅读过文章的相似文章来进行推荐。
基于相同城市的新闻:对于拥有相同地理信息的用户,会推荐与之相匹配的城市的热门文章。
基于文章关键词的推荐:对于每篇文章,提取关键词,作为描述文章内容的一种特征。然后与用户动作历史的文
章关键词进行匹配推荐。
基于站内热门文章的普适性推荐:根据站内用户阅读习惯,找出热门文章,对所有没有阅读过该文章的用户进行
推荐。
基于社交好友关系的阅读习惯推荐:根据用户的站外好友,获取站外好友转发评论或发表过的文章进行推荐。
基于用户长期兴趣关键词的推荐:通过比较用户短期和长期的阅读兴趣主题和关键词进行推荐。
基于相似用户阅读习惯的列表推荐:计算一定时期内的用户动作相似性,进行阅读内容的交叉性推荐。
基于站点分布来源的内容推荐:通过用户阅读的文章来源分布为用户计算出20个用户喜欢的新闻来源进行推荐。