Twitter 审核研究联盟 - 深入了解 Twitter 上对话的安全性和完整性。

最新推荐文章于 2024-10-29 16:44:15 发布

无脑敲代码，bug漫天飞

最新推荐文章于 2024-10-29 16:44:15 发布

阅读量138

点赞数

分类专栏：社交机器人检测文章标签： twitter

本文链接：https://blog.csdn.net/qq_40671063/article/details/133791532

版权

社交机器人检测专栏收录该内容

68 篇文章 62 订阅

订阅专栏

通过 Twitter 审核研究联盟（“TMRC”或“联盟”），Twitter 与全球成员团体共享有关平台审核问题的大规模数据集，其中成员包括来自学术界、民间社会、非政府组织和新闻界的公共利益研究人员，研究平台治理问题。

通过该联盟，Twitter 将继续支持我们现有的持续平台操纵活动数据集的披露，其中包含违反我们的平台操纵和垃圾邮件政策而发布的材料。随着时间的推移，我们打算与联盟分享有关其他政策领域的类似综合数据。

透明度是我们使命的核心，从一开始就是 Twitter 的重要组成部分。 2018 年 10 月，我们推出了业界第一个在 Twitter 上看到的潜在外国信息操作档案。该联盟继续并扩展了这种访问权限。我们将联盟设计为行业领先的组织，旨在提高 Twitter 内容审核政策和执行决策的透明度，以便可信的公共利益研究人员能够独立调查、学习并产生见解，为公众、政策制定者和其他研究人员提供信息。

我们的目标是提高影响平台健康的更多问题的透明度，同时应对该领域相当大的安全性和完整性挑战。我们希望通过向联盟披露信息来扩大透明度可以帮助我们所有人学习和建立必要的社会防御和能力来保护公共对话。

2. 常见问题解答

谁有资格加入联盟？

联盟成员资格需通过申请。我们的目的是具有包容性，同时确保联盟数据的隐私和安全及其道德和公共利益的使用。该联盟欢迎来自不同背景、经验和使用不同方法的研究人员的申请，他们进行与内容审核相关的数据驱动分析。

要成为合格的会员候选人，申请人必须证明以下内容：

他们与学术、新闻、非营利或民间社会研究组织有主要机构联系。如果是学生，则必须是硕士或博士级别的学生；本科生目前没有资格。

数据驱动分析的先前经验和相关技能。联盟数据集主要以 JSON 文件形式共享，需要技术技能才能进行分析。

联盟提供的数据的特定公共利益研究用例。（“公共利益研究用例”是指用于新闻、学术或非营利/民间社会目的的非商业研究。）

用于保护联盟提供的数据的隐私和安全的行业标准计划和系统。联盟成员需签署数据使用协议。

与联盟共享哪些数据？

分享有关非国家支持的行为者的持续平台操纵活动的类似全面数据

首先，我们将继续披露持续性平台操纵活动和信息操作，这些活动和信息操作是 Twitter 平台操纵和垃圾邮件政策所禁止的。（我们可以可靠地归因于政府或国家相关行为者的操纵被视为信息操作。）随着时间的推移，我们打算分享有关非国家支持的行为者的持续平台操纵活动的类似全面数据，以及其他内容审核政策领域和执行决策，届时我们将更新本页面，提供更多信息。我们共享的确切数据类型可能会有所不同，具体取决于相关活动的类型。

从 2018 年开始，联盟成员可以访问信息运营数据集档案。我们将这些信息操作归属于公开或内部。一旦我们的团队识别、删除并调查了这些活动和任何相关的违规内容，我们就会与联盟成员共享数据集。这些数据集包括来自我们认为与状态链接信息操作相关的帐户的个人资料信息、推文和媒体（例如图像和视频）。已删除的推文和媒体不包含在数据集中。与公共历史档案不同，联盟有权访问的数据未经过哈希处理。需要注意的是，并非所有被我们认定与这些活动相关的账户都会主动发布推文，因此数据集中的账户数量可能少于由于信息行动并被强制执行的账户总数。

由于数据集的大小，所有联盟数据集都要求成员能够分析大型数据集。

公开访问的信息运营档案与联盟有权访问的信息有何不同？

从 2018 年 10 月开始，我们发布了第一个与国家支持的信息运营相关的综合性公共数据档案。从那时起到 2022 年初，当我们启动 Twitter 审核研究联盟时，我们公开共享了来自 17 个国家的 37 个归因平台操纵活动的数据集，涵盖超过 2 亿条推文和 9 TB 的媒体。

随着 Twitter 审核研究联盟的出现，我们已停止发布公共数据集，而是专注于向联盟发布数据。现有的信息操作数据集档案仍然可以在下面下载——虽然没有任何内容被编辑，但一些特定于帐户的信息已被哈希以保护帐户隐私。

为什么可公开访问的信息操作档案要进行哈希处理？

对于关注者少于 5,000 名的帐户，我们对可公开访问的存档中的某些识别字段（例如用户 ID 和屏幕名称）进行了哈希处理。虽然我们已采取预防措施尽量减少这些数据集中的误报，但我们仍然对选定字段进行了哈希处理，以减少对真实或受损帐户产生负面影响的可能性，同时仍然能够对所创建的基础内容进行纵向研究、网络分析和评估通过这些帐户。

该联盟的成员可以访问这些数据集的未哈希版本以进行研究。联盟成员同意数据许可协议的条款，将未哈希数据集限制于研究目的，并确保研究人员只能根据特定限制并结合适当的安全措施使用数据集。

我还可以在哪里访问 Twitter 数据以进行研究？

如果您是学者，请在此处查看我们 API 的免费学术访问权限以进行研究。在此处了解有关常规 API 访问的更多信息。

如果我认为自己被错误地列入此处，该怎么办？

如果您认为您的帐户被错误地包含在这些数据集之一中，请登录您的 Twitter 帐户并在此处提交暂停上诉，以便我们进行全面审查。