【特征工程系列1】用户评价信息的特征化

这篇博客介绍了如何利用用户评价信息,特别是星级评价,来提取商品的质量特征。通过计算数学期望和对数期望来处理评价数据,以解决星级数量不平衡的问题。对数期望使得不同星级的权重更加均衡,有助于商品推荐系统的建立,并提到对数的基底是经验参数,需要通过实验确定。
摘要由CSDN通过智能技术生成

       在各种互联网平台中,或多或少都可以获得用户对商品、产品、服务等的评价信息(往往以星级或分数的形式展现)。通过这些信息,我们可以方便的提取这些商品、产品或服务的“质量”特征


       对于“质量”特征,常用的方法是求数学期望。例如,假设某一商品得到1星的次数是x1,2星的次数是x2,3星的次数为x3,4星的次数为x4,5星的次数为x5,这样,可以算出该商品的期望星数为:


E(x)=1*x1/(x1+x2+x3+x4+x5)+2*x2/(x1+x2+x3+x4+x5)+3*x3/(x1+x2+x3+x4+x5)

+4*x4/(x1+x2+x3+x4+x5)+5*x5/(x1+x2+x3+x4&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值