个性化推荐的基础是用户画像,而用户画像就是将用户标签化,用一个个标签去描述用户处用户的特征、喜好、行为习惯等信息。
![d0e68f18e0b4ce03c3864c902acdf245.png](https://i-blog.csdnimg.cn/blog_migrate/d437324fc9c9fa7513fe7f5ea833ad2c.jpeg)
上一篇文章我们介绍了常见的分发方式和算法分发的理论基础,这篇文章我们来进一步讨论,如何设计产品的性化推荐的规则。
标签库
个性化推荐的基础是用户画像,而用户画像就是将用户标签化,用一个个标签去描述用户处用户的特征、喜好、行为习惯等信息。为了数据标准化和规范化,我们需要在后台建立一个标签库,通过对标签库的维护,来满足用户画像的需求,并作为数据分析的依据。
所谓标签库,也就是标签的集合,讲标签组织化和结构化。在产品设计上,标签库就是一个标签的列表,并支持增删查改等基础的维护。
![9b06647146e04e8a3ffd5e45ca8fba29.png](https://i-blog.csdnimg.cn/blog_migrate/6000e1d5aea0c57ad5d8fbdfb62649c3.jpeg)
如果产品内容类型很丰富,那么标签的数量也会特别庞大。为了便于维护,也便于数据分析,最好能对标签进行分类管理,比如建立一个二级类目管理机制。
![8c8b1f6a15b7883e5d99fb4c4b0a5c8a.png](https://i-blog.csdnimg.cn/blog_migrate/e493b9a87827accc14a18cee91690c06.jpeg)
一级分类
![7fe1769a06ab9cc010b174d1811f839f.png](https://i-blog.csdnimg.cn/blog_migrate/5033bb69a8461d9e9aac38ebe84c8d7f.jpeg)
二级分类
内容标签化
通过对用户贴标签来了解用户的喜好是个性化推荐的基础,但是给用户贴标签的依据是什么呢?那就是用户跟内容的互动。用户阅读了一篇文章、看了一部视频、回答了一个问题,都是用来给用户贴表情呢依据。那么我们就得首先知道,这些文章视频内容属于什么标签,也就是将内容标签化。
如何将内容标签化呢?对于不同形态的内容,方法是不一样的。
对于文本内容,一般是通过关键字匹配。这里,标签库就要发挥作用了。通过技术手段识别文本中的关键字,如果与标签库中的标签匹配上,即可作为该内容的标签。
![42ee1e30daa3a1623d0cf94d4ca88d13.png](https://i-blog.csdnimg.cn/blog_migrate/d0a3845eee6af92ef9bd709b3667ba9f.jpeg)
如果是音视频内容,标签的识别可能就得依靠人工手段了,毕竟靠技术识别的难度太大。通过在后台给内容手动打标签,将音视频等内容标签化。
用户标签化
当用户与内容产生互动,比如阅读、点赞、收藏等行为,那么首先,我们就得统计用户的行为。如何统计呢?
首先,梳理用户与内容能产生的所有行为;然后,梳理这些行为能产生的所有字段信息;最后,在后台讲这些行为数据表格化。
![a76000f25f9487202b57b02e78bb94ba.png](https://i-blog.csdnimg.cn/blog_migrate/ec43ca448c20830b25a2cb9683180c05.jpeg)
![8472c8d1139e5dcb4177eebb48d3552e.png](https://i-blog.csdnimg.cn/blog_migrate/a62f2114b03cdcdd889fbe68d5d5b966.jpeg)
当用户与内容产生互动,即可认为这条内容的标签页属于用户的标签。为了画像更为精准,我们给用户的标签赋予一个权重的概念。用户的行为不同,该标签的权重值不同,比如仅仅是阅读的情况下,标签的权重+1,如果是点赞,则标签的权重值+2。通过一次次行为的积累,最终讲得到用户的标签权重表,而这张表,就是用户的画像。
![7c3eacea277329c76d25bde271443090.png](https://i-blog.csdnimg.cn/blog_migrate/90110fb7454cb3481db364be08a0f4ff.jpeg)
不过,给用户标签赋值要考虑到多种因素,比如时间效应。用户兴趣会随着时间而衰减,因此减少对应的分值。还要考虑到热门内容的干扰,比如某个明星离婚的消息。用户看此类消息可能仅仅是一时的好奇,并不代表对此类标签(八卦、明星)的内容感兴趣,因此这类行为的权重值要降低。
![a2e0a2502f9033a752768a702a8a7895.png](https://i-blog.csdnimg.cn/blog_migrate/16a0dbdd3fbcbb341a99a869aee63388.jpeg)
个性化推荐规则
将用户和内容标签化之后,要实现个性化推荐,还需要最后一步:制定个性化推荐规则。所谓个性化推荐,就是根据用户画像,给用户做精准推荐。这里,我们举一个例子:
规则1.选择匹配该用户标签权重值排前5的相关内容
规则2.筛选满足规则1的且是最近48小时内发布的内容
1.分页推送,每页8条,按照点赞数从多到少排列,上滑翻页
2.下拉刷新,推送本次刷新与上次刷新之间产生的满足规则1和规则2的内容,根据分值从高到低排列,每次刷新最多推送8条,不足8条则推送实际数量
3.已推荐过的内容则不再推荐
以上是一个比较简单的推荐规则,重点是要通过这个规则体现个性化推荐的应用思路,读者可以根据自身产品的实际需要制定更详细的规则。
![d1a2e0cef0e861f5a9b3ec4db946288d.png](https://i-blog.csdnimg.cn/blog_migrate/0b4e1b7571bc3b8b47427538d65da04a.jpeg)
小结
除了内容产品,很多业务场景都适合个性化推荐,比如电商的“猜你喜欢”,感兴趣的读者可以自己设计一套电商业务的个性化推荐体系。