产品综合评价模型——基于商品评论建立的产品综合评价模型(2)

5.产品评分模型

5.1单条评论评分模型

我们希望通过评论文本与星级建立一个评分模型,通过该模型可以得到单条评论的打分情况,从而观察到各产品的综合评价。为达到这个目的,我们将结合星级1、点赞数2、总投票数3这几项数据集,先建立单条评论评分模型。
由于评分模型得出的分数,我们希望它的取值范围为[0,100],因此输入评分模型的评论得分与星级得分也应是百分制数据。

5.1.1评论得分

本部分将计算出能够直接输入打分模型的评论得分。由于原始情感得分仅表示该购买人的个人想法,无法体现他人是否认同该评论,因此我们将其依据可信度进行优化。此后,通过TOPSIS法,我们可以得到最后能输入打分系统的评论得分数据。

1). 优化情感得分

在上述的LDA主题模型中,我们剔除了评论文本中的中性文本。但在本模型中为保证评分的完整性和准确性,我们重新保留了中性文本。因此所有评论的情感得分取值范围为[-1,1],即x∈[-1,1]
不同的评论由于评价者的情况不同而具有不同的可信度,我们希望能让评论对产品评分的影响能依据其可信度进行适当调整。这里我们引入一个新变量“点赞权重系数”,用来将可信的评论影响放大,不可信的评论影响缩小,由此得到的优化后的情感得分a’公式计算如下:
a ′ a^{'} a= x x x*(点赞权重系数+1)

接下来我们要计算点赞权重系数。

通过对原数据的观察,我们决定用总投票数和点赞数两个指标作为计算点赞权重系数的原始数据。
通过观察总投票数的大小,我们将数据依据总投票数将数据分为三类:○1总投票数非常小:该情况下,对该评论表示认同或者不认同的人数过少,无法判断该评论是否更可信,因此我们不给予这类数据更多的信任;○2总投票数较小:该情况下,已经有部分人对该评论发表其观点,可稍微看出该评论是否可信,因此我们对它的信任改变 δ 1 \delta_1 δ1;○3总投票数较大:该情况下,由大量的人表示认同该评论或者不认同,我们可以明确它的可信度,对这类数据我们的信任改变 δ 2 \delta_2 δ2
为避免对数据影响过大,造成结果不合理。在对原始数据进行观察后,我们决定将划分类别的两个界限定为:10,50;并且设定 a 1 a_1 a1=0.1, a 2 a_2 a2=0.15。由此可知点赞权重系数公式如下:

2). TOPSIS法获得最终数据

通过上一个步骤,我们已经得到了优化后的评价得分 a ′ a^{'} a,接下来我们将通过TOPSIS法获得最终的评价得分 a a a
在这里插入图片描述
引入变量n表示导入的数据集中的评论总条数。
步骤一:
将优化后的评论得分 a ′ a^{'} a

  • 12
    点赞
  • 47
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值