头条推荐系统项目实战
文章平均质量分 52
晚点吧
。。。。点
展开
-
推荐系统项目实战二(离线画像建立)
1 离线画像流程 画像构建内容: 画像的构建作为推荐系统非常重要的环节,画像可以作为整个产品的推荐或者营销重要依据。需要通过各种方法来构建。 文章内容标签化:内容标签化,根据内容定性的制定一系列标签,这些标签可以是描述性标签。针对于文章就是文章相关的内容词语。 文章的关键词、主题词 用户标签化:这个过程就是需要研究用户对内容的喜好程度,用户喜欢的内容即当作用户喜好的标签。 在用户行为记录表中,我们所记下用户的行为在此时就发挥出重要的作用了。用户的浏览(时长/频率)、点击、原创 2021-04-13 23:50:22 · 424 阅读 · 0 评论 -
推荐系统项目实战一(推荐业务架构介绍)
架构与业务流 基础数据层: 包括业务数据和用户行为日志数据。 业务数据主要包含用户数据和文章数据,用户数据即黑马头条注册用户的基础数据,文章数据在自媒体平台上传的文章的基本信息。 用户行为日志数据来源于前端埋点 业务批量存储在HDFS上以用作离线分析 日志数据实时流向Kafka以用作实时计算 数据处理层: 基础计算:基于离线和实时数据,对各类基础数据计算成用户画像、文章画像 召回与排序 召回环节使用各种算法逻辑从海量的文章中筛选出用户感兴趣的文章候选集合,原创 2021-04-13 23:31:58 · 967 阅读 · 1 评论