4CAT: The 4CAT Capture & Analysis Toolkit
4CAT 是一个研究工具,主要用于从在线社交平台捕获和分析数据。它的目标是通过一个网络界面,使数据的捕获和分析变得更加便捷,无需编程或网页抓取技能。以下是该工具的主要特点和功能:
功能与特点
-
目标用户:
- 研究人员
- 学生
- 新闻工作者
- 对数字方法(Digital Methods)感兴趣的其他人群
-
数据捕获与分析:
- 用户可以根据特定参数从指定平台创建数据集(通常是 CSV 或 JSON 文件)。
- 数据可以被下载,或者通过内置的分析工具进一步处理。
- 分析工具包括简单的频率图表到复杂的分析(如生成和可视化词嵌入模型)。
-
支持的数据来源:
- 直接支持的来源:
- 4chan
- Telegram
- Tumblr
- 通过 Zeeschuimer 支持的数据来源(数据需先采集后导入 4CAT):
- Instagram(帖子)
- TikTok(帖子和评论)
- 9gag
- Imgur
- Gab
- Douyin
- 支持 CSV 数据上传:
- Facebook 和 Instagram 数据(通过 CrowdTangle 或 Facepager 导出)
- YouTube 视频与评论(通过 YouTube Data Tools)
- 微博(通过 Bazhuayu)
- 直接支持的来源:
-
扩展功能:
- 用户可以使用 4CAT 的 Python API 添加额外的数据来源。
- 支持上传其他工具生成的 CSV 数据,只要格式符合要求。
资源与支持
-
教程与文档:
- 视频教程:如何创建数据集并运行分析,如何使用 Docker 安装 4CAT。
- 实验练习:尝试各种分析以熟悉工具功能。
- 分析工作表:包括媒体分析、Twitter API 使用等。
- Zeeschuimer:一个捕获 TikTok 和 Instagram 数据的浏览器扩展。
-
高级功能:
- 源代码和安装指南(通过 Docker 或源码安装)可在 GitHub 上获取。
- DMI Service Manager:在服务器上运行机器学习模型并连接到 4CAT,以在工具中运行基于机器学习的处理器。
研究支持
4CAT 的开发得到了以下项目和机构的支持:
- 阿姆斯特丹大学(University of Amsterdam)
- 欧洲研究委员会(European Research Council)
- 数字方法倡议(Digital Methods Initiative)
- 英国国王学院(King's College London)
限制
- 目前没有公开的 4CAT 服务器,用户需通过自己的大学或机构运行 4CAT。
- 也可以通过 Docker 在本地安装和运行。
如果您对 4CAT 感兴趣,可以访问其官方网站 4CAT 获取更多详细信息。