摘要 大多数关于检测先令攻击的研究都集中在用户的评分行为上,但没有考虑到攻击者也可能攻击用户的信任行为。例如,攻击者可能会给其他用户的评分打低分,这样人们就会认为用户的评分没有帮助。在本文中,我们定义了信任先令攻击,提出了信任攻击的行为特征,并提出了一种使用机器学习方法的有效检测方法。实验结果表明,基于我们提出的信任攻击行为特征,我们可以准确地检测信任先令攻击以及传统的先令攻击。
1.介绍
推荐系统在信息过滤方面取得了巨大成功,并有效地解决了信息过载问题。但由于对用户历史信息的依赖,部分异常用户利用欺骗手段将攻击用户的信息注入推荐系统,并操纵这些用户模拟正常用户的评分和评论,从而提高或降低推荐系统的推荐频率。目标产品。这种行为被称为“先令攻击”。攻击性行为会干扰推荐系统的正常结果,损害普通用户的根本利益,降低普通用户的推荐体验和推荐质量,从而危及推荐系统的安全性和鲁棒性。
学者们在先令攻击领域进行了研究和探索,尤其是在检测方面。他们在基于分类模型 [2]-[4]、半监督学习算法 [5]-[8]、无监督模型 [9]、[10] 和特征选择[11],[12]。
除了直接给物品打分外,用户还可以给其他用户的打分和评论打分或喜欢/不喜欢。用户对评分的评分或用户对评论的点赞/不喜欢代表了用户对评分/评论的信任。先令攻击者不仅可以直接攻击目标项目,例如直接给予评分,还可以攻击高/低评分。例如,攻击者可能会对普通用户对目标项目的高评分给予低分,或者对用户的低评分和评论给予高分。如果很多用户对某项评论表示不喜欢,则会大大降低收到该项推荐信息的用户的信任度,从而破坏推荐系统的有效性和可信度。
检测基于信任的先令攻击至关重要。我们将这种攻击——对普通用户的高评分给予低分,对普通用户的低评分给予高分——定义为信任先令攻击。然而,很少有研究与基于信任的先令攻击有关。因此,在本文中,我们定义了信任先令攻击,提取了基于可信的特征,并提出了一种机器学习算法来检测信任先令攻击。
本文的其余部分安排如下。sect2、我们定义了信任先令攻击。sect 3,我们介绍我们的方法论,并在 Sect. 4,我们展示了实验结果。第 5 节给出了本文的结论。
2. 信任先令攻击
2.1 信任评级的定义
许多在线网站不仅直接为用户提供项目评级,还提供其他用户评级/评论的评级。其他人的评分/评论的评分揭示了用户在多大程度上信任其他用户的评分/评论。因此,我们将给他人的评分/评论评分定义为信任评分。
2.2 信任先令攻击的定义
我们将以下任何一种情况定义为