一、实验目的
- 了解并掌握网络爬虫的基本原理
- 动手实现动态获取全国新型冠状病毒疫情现状
二、实验环境
- Windows10
- Pycharm 2020.1
- python 3.7
三、实验材料
- 数据来源:https://news.qq.com/zt2020/page/feiyan.htm#/
- Requests模块
- Seaborn 绘图
四、数据结构分析
通过浏览器“审查元素”查看源代码及“网络”反馈的消息,如下图所示:
对应的响应信息如下所示:
使用json格式化,将获取的响应信息展开:
截取出需要的数据字段标识:
五、请求
- 通过Requests模块对网页发送请求,确定url地址,通过数据表看到时间戳为8位,*1000补足11位,进行实时获取。
- Url网址: