twitter推特全量用户收集与发文采集

twitter推特全量用户收集与发文采集

twitter推特全量用户收集与发文采集

为了研究各国的总统选举期间的民调,x项目需要M国全量推特用户的发文数据,以此为背景,需要将推特大部分用户(70%)的推特uid,screen_name,name,local等信息收集起来

用传统方式,按用户名搜索,从粉丝栏采集等方式,只能获取到伪全量用户,想要获得全量用户数据,即要通过遍历uid或者直接入侵推特系统

2020年推特日活用户1.7亿,月活用户3.9亿,注册用户预计28亿,要是将这些用户数据简单的uid-screen_name-name-local的方式存txt,预计文件大小达494G,压缩后文件也有80G左右,因此,靠普通的爬虫方式进行爬取,我想很难收集这么多的用户数据
因此,想要获得完整的推特用户数据做社科研究,要么直接找官方合作,要么找一个专业的推特爬虫做数据支持。
现实问题是,社交巨头的用户信息,与现实生活中工业系统的石油一样,中国公司像问美国公司要巨量的社交用户数据做社科研究是不现实的,我坦白,我从宽,我研究twitter采集多年

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值