通过 Twitter 审核研究联盟(“TMRC”或“联盟”),Twitter 与全球成员团体共享有关平台审核问题的大规模数据集,其中成员包括来自学术界、民间社会、非政府组织和新闻界的公共利益研究人员,研究平台治理问题。
通过该联盟,Twitter 将继续支持我们现有的持续平台操纵活动数据集的披露,其中包含违反我们的平台操纵和垃圾邮件政策而发布的材料。随着时间的推移,我们打算与联盟分享有关其他政策领域的类似综合数据。
透明度是我们使命的核心,从一开始就是 Twitter 的重要组成部分。 2018 年 10 月,我们推出了业界第一个在 Twitter 上看到的潜在外国信息操作档案。该联盟继续并扩展了这种访问权限。我们将联盟设计为行业领先的组织,旨在提高 Twitter 内容审核政策和执行决策的透明度,以便可信的公共利益研究人员能够独立调查、学习并产生见解,为公众、政策制定者和其他研究人员提供信息。
我们的目标是提高影响平台健康的更多问题的透明度,同时应对该领域相当大的安全性和完整性挑战。我们希望通过向联盟披露信息来扩大透明度可以帮助我们所有人学习和建立必要的社会防御和能力来保护公共对话。
2. 常见问题解答
谁有资格加入联盟?
联盟成员资格需通过申请。我们的目的是具有包容性,同时确保联盟数据的隐私和安全及其道德和公共利益的使用。该联盟欢迎来自不同背景、经验和使用不同方法的研究人员的申请,他们进行与内容审核相关的数据驱动分析。
要成为合格的会员候选人,申请人必须证明以下内容:
他们与学术、新闻、非营利或民间社会研究组织有主要机构联系。如果是学生,则必须是硕士或博士级别的学生;本科生目前没有资格。
数据驱动分析的先前经验和相关技能。联盟数据集主要以 JSON 文件形式共享,需要技术技能才能进行分析。
联盟提供的数据的特定公共利益研究用例。 (“公共利益研究用例”是指用于新闻、学术或非营利/民间社会目的的非商业研究。)
用于保护联盟提供的数据的隐私和安全的行业标准计划和系统。联盟成员需签署数据使用协议。
与联盟共享哪些数据?
分享有关非国家支持的行为者的持续平台操纵活动的类似全面数据
首先,我们将继续披露持续性平台操纵活动和信息操作,这些活动和信息操作是 Twitter 平台操纵和垃圾邮件政策所禁止的。 (我们可以可靠地归因于政府或国家相关行为者的操纵被视为信息操作。)随着时间的推移,我们打算分享有关非国家支持的行为者的持续平台操纵活动的类似全面数据,以及其他内容审核政策领域和执行决策,届时我们将更新本页面,提供更多信息。我们共享的确切数据类型可能会有所不同,具体取决于相关活动的类型。
从 2018 年开始,联盟成员可以访问信息运营数据集档案。我们将这些信息操作归属于公开或内部。一旦我们的团队识别、删除并调查了这些活动和任何相关的违规内容,我们就会与联盟成员共享数据集。这些数据集包括来自我们认为与状态链接信息操作相关的帐户的个人资料信息、推文和媒体(例如图像和视频)。已删除的推文和媒体不包含在数据集中。与公共历史档案不同,联盟有权访问的数据未经过哈希处理。需要注意的是,并非所有被我们认定与这些活动相关的账户都会主动发布推文,因此数据集中的账户数量可能少于由于信息行动并被强制执行的账户总数。
由于数据集的大小,所有联盟数据集都要求成员能够分析大型数据集。
公开访问的信息运营档案与联盟有权访问的信息有何不同?
从 2018 年 10 月开始,我们发布了第一个与国家支持的信息运营相关的综合性公共数据档案。从那时起到 2022 年初,当我们启动 Twitter 审核研究联盟时,我们公开共享了来自 17 个国家的 37 个归因平台操纵活动的数据集,涵盖超过 2 亿条推文和 9 TB 的媒体。
随着 Twitter 审核研究联盟的出现,我们已停止发布公共数据集,而是专注于向联盟发布数据。现有的信息操作数据集档案仍然可以在下面下载——虽然没有任何内容被编辑,但一些特定于帐户的信息已被哈希以保护帐户隐私。
为什么可公开访问的信息操作档案要进行哈希处理?
对于关注者少于 5,000 名的帐户,我们对可公开访问的存档中的某些识别字段(例如用户 ID 和屏幕名称)进行了哈希处理。虽然我们已采取预防措施尽量减少这些数据集中的误报,但我们仍然对选定字段进行了哈希处理,以减少对真实或受损帐户产生负面影响的可能性,同时仍然能够对所创建的基础内容进行纵向研究、网络分析和评估通过这些帐户。
该联盟的成员可以访问这些数据集的未哈希版本以进行研究。联盟成员同意数据许可协议的条款,将未哈希数据集限制于研究目的,并确保研究人员只能根据特定限制并结合适当的安全措施使用数据集。
我还可以在哪里访问 Twitter 数据以进行研究?
如果您是学者,请在此处查看我们 API 的免费学术访问权限以进行研究。在此处了解有关常规 API 访问的更多信息。
如果我认为自己被错误地列入此处,该怎么办?
如果您认为您的帐户被错误地包含在这些数据集之一中,请登录您的 Twitter 帐户并在此处提交暂停上诉,以便我们进行全面审查。
3 下载哈希信息操作档案(2018-2022)
从 2018 年 10 月开始,我们发布了第一个与国家支持的信息运营相关的综合性公共数据档案。从那时起到 2022 年初,当我们启动 Twitter 审核研究联盟时,我们公开共享了来自 17 个国家的 37 个归因平台操纵活动的数据集,涵盖超过 2 亿条推文和 9 TB 的媒体。
随着 Twitter 审核研究联盟的出现,我们已停止发布公共数据集,而是专注于向联盟发布数据。现有的信息操作数据集档案仍然可以在下面下载——虽然没有任何内容被编辑,但一些特定于帐户的信息已被哈希以保护帐户隐私。
您可以通过输入您的电子邮件地址并单击“提交”来下载数据集。您对数据集的使用受 Twitter 开发者协议和政策的约束。单击“提交”即表示您同意 Twitter 开发者协议和政策。
如果您认为您的帐户被错误地包含在其中一个数据集中,请登录您的 Twitter 帐户并在此处提出暂停申诉。我们仔细审查这些案例,也许能够帮助恢复可能受到损害的帐户或可能被错误包含的帐户。
4 申请加入联盟
感谢您有兴趣加入 Twitter 审核研究联盟!在填写此处和下面链接的申请之前,请先阅读完整的概述。
联盟成员资格需通过申请。我们的目的是具有包容性,同时确保联盟数据的隐私和安全及其道德和公共利益的使用。该联盟欢迎来自不同背景、经验和使用不同方法的研究人员的申请,他们进行与内容审核相关的数据驱动分析。
要成为合格的会员候选人,申请人必须证明以下内容:
他们与学术、新闻、非营利或民间社会研究组织有主要机构联系。如果是学生,则必须是硕士或博士级别的学生;本科生目前没有资格。
数据驱动分析的先前经验和相关技能。联盟数据集主要以 JSON 文件形式共享,需要技术技能才能进行分析。
联盟提供的数据的特定公共利益研究用例。 (“公共利益研究用例”是指用于新闻、学术或非营利/民间社会目的的非商业研究。)
用于保护联盟提供的数据的隐私和安全的行业标准计划和系统。联盟成员需签署数据使用协议。
无资格加入联盟集团的
此外,如果申请人符合以下条件,则没有资格加入联盟:
是本科生;只有硕士或博士水平的学生才有资格。
将行业和政府职位作为其主要机构所属机构。
不属于学术界、新闻业、非营利组织或民间社会研究组织的主要机构。
计划与政府或其他外部各方共享联盟的数据。
申请处理和审查
申请将由 Twitter 进行审核,申请人将收到接受或拒绝的通知。成功的申请者将是具有独立研究历史的研究人员,或者满足其他标准,证明有能力接受联盟数据并为合格目的进行研究。符合联盟目的的合格研究是学术、新闻、非营利或民间社会研究,旨在更好地了解内容审核和平台完整性问题。
一旦被联盟接受,合格的研究人员就可以访问数据集以独立工作。 一旦被联盟接纳,合格的研究人员即可访问数据集,独立开展工作。Twitter 对联盟数据集、发布或更新的质量、性质或频率;联盟成员从事的工作或合格研究类型不作任何陈述;不审查也不参与联盟合格研究人员的决策或工作成果。
您填写本申请表的决定完全出于自愿。提交申请即表示您同意我们使用您的回答来评估您成为联盟成员的资格。您的个人回答是保密的,您的个人信息仅用于评估您的参与资格。如果您在提交申请后希望撤回申请,请回复我们确认收到您申请的电子邮件。您也可以点击此处联系 Twitter。
填写和提交申请的提示
我们建议您全面审查申请,提前在单独的文档中起草回复,并在准备提交时在表格中输入所有最终回复。您与我们分享的信息越多,我们就越容易审查和考虑您的申请的资格。
请用英文填写申请表。