python爬取客流数据_Python爬取南京地铁微博发布客流数据并进行分析

Python爬取南京地铁微博发布客流数据并进行分析

之前在网上看到了分析北京地铁客流数据的开源项目,就想试着分析一下南京地铁的客流数据,可是找了很久没有找到可以获得南京地铁客流数据的接口,就去南京地铁微博看了一下,果然跟北京地铁一样,基本上每天都会更新客流数据。所以开始动手~

爬南京地铁微博,获取有用的数据并保存成txt文件

首先,百度搜一下Python爬新浪微博内容的框架,有很多很多,我们选择一个,随便改改,发现可以用啦:

南京地铁微博ID:2638276292

根据下面的条件进行初步的筛选,基本上可以找到对应的微博。

weibocontentindex=str(text).find("南京地铁")

weibocontentindex2=str(text).find("客运")

if weibocontentindex > -1 and weibocontentindex2 > -1:

fh.write(text[weibocontentindex-1:]+'\n')

然后我们就初步保存了南京地铁微博中发布的客流数据。

7fd7247a8384b146501c3424d25e8328.png

读取txt文件,整理好数据后存入sqlite3数据库

因为微博是工作人员发布的,存在一些文本格式上的问题,还有表述上的区别,所

  • 0
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值