读书笔记//《用户画像》之数学模型的应用

本文介绍了信息技术在用户标签权重计算中的应用,包括朴素贝叶斯在文本分类中的使用,TF-IDF原理及其在用户标签权重中的作用,时间衰减系数如何结合行为数据计算用户标签权重,余弦相似度在标签相似度计算中的应用,以及RFM模型在用户价值标签中的应用。这些方法用于提升推荐系统的精准度和个性化体验。
摘要由CSDN通过智能技术生成

出版时间:2019年
点评:这本书干货满满啊。

1.朴素贝叶斯
page92
应用:文本分类

比如,给文章自动打上分类标签。

2.TF-IDF
page112
应用:用户标签权重

原理:字词的重要性随着它在文件集中出现的次数的增加成正比增加,同时随着它在语料库中出现的频率成反比下降。

延伸应用:对于每个用户来说,其身上同一个标签出现的次数越多,该标签对于这个用户来说越重要,该标签中全部用户的所有标签产生的标签集中出现的次数越多,该标签的重要性越低。

3.时间衰减系数
page114
应用:用户标签权重

参考原理:牛顿冷却定律数学模型
F(t)=初始温度 * exp(-a * 间隔的时间)

延伸应用:随着时间的推移,用户的历史行为和当前行为的相关性不断减弱。如:用户搜索图书、用户搜索图书对应作者

用户标签权重=行为类型权重 * 时间衰减 * 用户行为次数 * TF-IDF计算标签权重

通过以上公式,可以对用户特征库的行为数据计算权重标签,筛选出与用户行为相关性最大的标签。

4.余弦相似度函数
page120
应用:标签相似度计算

通过对用户的标签构建“同现矩阵”的方式对标签进行聚类。如将疾病标签聚类到其对应的科室。

5.RFM用户价值模型
page75
应用:用户价值类标签

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值