数字人文工具 | 4CAT 捕获与分析工具包

4CAT: The 4CAT Capture & Analysis Toolkit

4CAT 是一个研究工具,主要用于从在线社交平台捕获和分析数据。它的目标是通过一个网络界面,使数据的捕获和分析变得更加便捷,无需编程或网页抓取技能。以下是该工具的主要特点和功能:


功能与特点

  1. 目标用户

    • 研究人员
    • 学生
    • 新闻工作者
    • 对数字方法(Digital Methods)感兴趣的其他人群
  2. 数据捕获与分析

    • 用户可以根据特定参数从指定平台创建数据集(通常是 CSV 或 JSON 文件)。
    • 数据可以被下载,或者通过内置的分析工具进一步处理。
    • 分析工具包括简单的频率图表到复杂的分析(如生成和可视化词嵌入模型)。
  3. 支持的数据来源

    • 直接支持的来源
      • 4chan
      • Telegram
      • Tumblr
    • 通过 Zeeschuimer 支持的数据来源(数据需先采集后导入 4CAT):
      • Instagram(帖子)
      • TikTok(帖子和评论)
      • 9gag
      • Imgur
      • LinkedIn
      • Gab
      • Douyin
      • Twitter
    • 支持 CSV 数据上传
      • Facebook 和 Instagram 数据(通过 CrowdTangle 或 Facepager 导出)
      • YouTube 视频与评论(通过 YouTube Data Tools)
      • 微博(通过 Bazhuayu)
  4. 扩展功能

    • 用户可以使用 4CAT 的 Python API 添加额外的数据来源。
    • 支持上传其他工具生成的 CSV 数据,只要格式符合要求。

资源与支持

  • 教程与文档

    • 视频教程:如何创建数据集并运行分析,如何使用 Docker 安装 4CAT。
    • 实验练习:尝试各种分析以熟悉工具功能。
    • 分析工作表:包括媒体分析、Twitter API 使用等。
    • Zeeschuimer:一个捕获 TikTok 和 Instagram 数据的浏览器扩展。
  • 高级功能

    • 源代码和安装指南(通过 Docker 或源码安装)可在 GitHub 上获取。
    • DMI Service Manager:在服务器上运行机器学习模型并连接到 4CAT,以在工具中运行基于机器学习的处理器。

研究支持

4CAT 的开发得到了以下项目和机构的支持:

  • 阿姆斯特丹大学(University of Amsterdam)
  • 欧洲研究委员会(European Research Council)
  • 数字方法倡议(Digital Methods Initiative)
  • 英国国王学院(King's College London)

限制

  • 目前没有公开的 4CAT 服务器,用户需通过自己的大学或机构运行 4CAT。
  • 也可以通过 Docker 在本地安装和运行。

如果您对 4CAT 感兴趣,可以访问其官方网站 4CAT 获取更多详细信息。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值