关于推特社交机器人数据集（来自上一篇论文）

最新推荐文章于 2023-11-06 13:24:40 发布

无脑敲代码，bug漫天飞

最新推荐文章于 2023-11-06 13:24:40 发布

阅读量1.2k

点赞数

分类专栏：社交机器人检测数据集文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40671063/article/details/126133312

版权

社交机器人检测同时被 2 个专栏收录

66 篇文章 54 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

论文论文阅读 - A Deep Learning Approach for Robust Detection of Bots in Twitter Using Transformers_努力学习中....的博客-CSDN博客社交机器人论文阅读 - A Deep Learning Approach for Robust Detection of Bots in Twitter Using Transformershttps://blog.csdn.net/qq_40671063/article/details/126114489A Deep Learning Approach for Robust Detection of Bots in Twitter Using Transformers论文阅读 - A Deep Learning Approach for Robust Detection of Bots in Twitter Using Transformers_努力学习中....的博客-CSDN博客社交机器人论文阅读 - A Deep Learning Approach for Robust Detection of Bots in Twitter Using Transformershttps://blog.csdn.net/qq_40671063/article/details/126114489

介绍的数据集

在过去的几年里，通过社交媒体平台(如 Twitter、 Facebook 或 Instagram)传播错误信息的指数增长促进了应用研究，以便发现并防止这类内容在这些网络中的入侵。因此，很明显，人工智能(AI)在这个话题中扮演着至关重要的角色，以支持这些平台，根据一组特定的描述符或特征，从而自动通知或限制对那些看起来可疑的账户的访问。

举个例子，2019年，推特不得不删除了超过2.6万个账户，因为他们被怀疑传播虚假信息和/或不适当的内容。那么，问题是，人工智能如何支持终端用户检测可疑账户?

该数据集由超过30K行组成，对应于来自Twitter的不同用户帐户。每行包含两列:Tweet ID和指示其类别(bot或human)的标签。

以前的调查和数据集都来自这个机器人仓库（Bot Repository），它专注于这个主题。

该数据集由 37438 行组成，对应于 Twitter 中的不同用户帐户。每行包含帐户的 Twitter ID 和目标变量。

目标变量被表示为account_type，并且具有惟一的值(bot或human)。更具体地说，25013个用户帐户被注释为人类帐户，而其余12425个是机器人帐户。

数据集可以从Twitter Bots Accounts | Kaggle 网站下载，是更新后的账户（删除已经失效了的账户）：。

该数据集是由一组小型数据集组成的，这些数据集来自此前对Twitter可疑账户的调查。更具体地说，这些数据集有Twitter用户账户的标识符列表，以及一个标签，表示该账户是机器人还是人类。为了生成这个数据集，使用标识符在整个Twitter API中搜索和检索用户帐户的数据。因此，提出的数据集是一个更紧凑和更完整的版本，以提高分析。此外，那些不再属于Twitter的帐户将从数据集中删除，其余用户的数据将根据检索时的数据进行更新(13-07-2020)。

还可以下载经过Twitter API收集后的账户，下载链接为：bots_accounts_eda | Kaggle，此数据集由37438行组成，这些行对应于 Twitter 中的不同用户帐户。每行包含20列，这些列是通过 Twitter API 收集的特性。

目标变量被表示为account_type，并且具有惟一的值(bot或human)。更具体地说，25013个用户帐户被注释为人类帐户，而其余12425个是机器人帐户。

无脑敲代码，bug漫天飞

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
关于推特社交机器人数据集（来自上一篇论文）

关于推特社交机器人数据集（来自上一篇论文）
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。