caverlee数据集下载

本文详细描述了一项长期研究,使用Twitter上的60个社会蜜罐来监测和分析内容污染者,如垃圾邮件发送者和恶意软件传播者。研究涉及用户行为分析、链接有效负载检查和特征评估,以探讨自动识别这些污染者的方法。
摘要由CSDN通过智能技术生成

caverlee

下载地址:https://infolab.tamu.edu/data/
源自论文:Lee, Kyumin, Brian David Eoff, and James Caverlee. "Seven Months with the Devils: A Long-Term Study of Content Polluters on Twitter." ICWSM. 2011.

论文链接:http://faculty.cse.tamu.edu/caverlee/pubs/lee11icwsm.pdf

摘要:与Twitter和Facebook等社交网站的流行同步,这些网络上不受欢迎的、破坏性的实体--包括垃圾邮件发送者、恶意软件传播者和其他内容污染者--也在崛起。受致力于确保公地成功的社会学家和专注于阻止破坏行为和预泄犯罪的犯罪学家的启发,我们提出了第一个关于社会蜜罐的长期研究,用于诱惑、剖析和过滤社交媒体中的内容污染者。具体来说,我们报告了我们在Twitter上部署60个蜜罐的七个月的经验,结果收获了36000个候选内容污染者。作为研究的一部分,我们(i)检查了被骚扰的Twitter用户,包括分析链接的有效载荷、用户在一段时间内的行为以及关注者/关注网络的动态;(ii)评估了一系列的特征,以调查自动识别内容污染者的有效性。

描述:这个社会蜜罐数据集从2009年12月30日至2010年8月2日在Twitter上收集。该数据集包含22223个内容污染者,他们在一段时间内的关注人数,2,353,473条推文,以及19276个合法用户,他们在一段时间内的关注人数,3,259,693条推文。

数据集 caverlee包含语义和属性信息;

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值