学习日志之杂记(2)

《南加州大学covid-19资料整理》有关

今天在微博上无意间看到了这个数据集https://github.com/echen102/COVID-19-TweetIDs.这个数据集收录了从1月22日以来在twitter上有关新冠肺炎的发言,在这个repository中由于保密协议的原因并没有公开具体的言论而是公开了发言的账号。我觉得我在这理解上会有问题,我之前对这个的理解是用这些账号能通过在命令窗口中的一系列操作最终得到一个文本,里面记录了所有有关这个话题的发言文档,用于舆情分析之类的,这里可能我的理解会有问题,因为目前为止我也没有获取到我想要的东西,所有的东西都只是统计数据。不过在此过程中为了下载也是费了一点心思,因为有一个词hydrate并不是很懂,不过现在的理解大概就是根据ID来找其发言的记录,这里提供里一个hydrate的python脚本,这个脚本是需要在Twarc上下载了,也可以直接使用hydrator的GUI直接下载。用hydrate在命令提示符中下载的话需要配置twarc(ps这里在说明中讲的不是很详细),因为这样的缘由并没有在这里hydrate下来。但是按照其步骤在twitter上发现了一个twitter留出的开发平台接口,只要调用这个接口就可以进行APP的开发,但是有一点没有理解的是为何需要一个网页的URL,这个网页的URL是如何关联这个APP的还有待研究,还是说我理解错误仅仅是twitter提供给app开发者一个调用的接口,然后通过API调用返回用户希望在这个平台上得到的信息,用于用户数据分析,从而给使用APP的用户提供个性化的服务。不管怎么说最后申请完了之后就得到了一个token和一个access key。但是根据cmd的提示并不能配置成功,这个要怎么继续下载还需要进一步研究。

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值