python scratch file_py-scratch: 第一个python项目,使用requests抓取数据,Beautiful Soup(bs4)库处理数据,然后将数据存入mongodb...

py-scratch

下载项目->导入项目->运行项目

导入项目:下载项目后导入到pycharm中,然后需要下载requirements.txt中的包,如果发现pycharm没有自动下载包的话可以手动下载

,先安装pip,然后在命令行中敲:pip install bs4 pymongo requests json。当然也可以用:pip install -r requirements.txt直接下载。

运行项目:在pycharm中直接右击scratch_flight_number.py然后点Run就可以,命令行下用 python scratch_flight_number.py

项目说明:项目是根据某个固定的url去爬取网页或json,然后使用bs4做解析。获取到了想要的数据之后和原来的数据作比较,判断原数

据中是否包含新数据,如果不包含则添加到新的数组中返回,返回后将新数据追加到文件中同时插入到mongodb中

注意事项:

1,随着时间的推移url可能会过期

2,第一次运行项目可能会等待时间较长

3,注意这里插入到数据库中的数据是每次爬取到的新数据,如果没有新数据则不会插入

4,对项目有疑问可在微信公众号中与我交流,微信公众号:裸睡的猪

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值