爬虫学习日志10--获取疫情首页数据并保存完整代码

最新推荐文章于 2023-04-27 09:55:14 发布

@白圭

最新推荐文章于 2023-04-27 09:55:14 发布

阅读量907

点赞数

分类专栏： python--爬虫学习文章标签：爬虫 python json

本文链接：https://blog.csdn.net/taiyuezyh/article/details/122777621

版权

python--爬虫学习专栏收录该内容

12 篇文章 2 订阅

订阅专栏

前言

这篇文章主要讲述如何获取疫情首页数据并且保存。

一、代码

import requests
from bs4 import BeautifulSoup
import re
import json
#1.发送请求，获取疫情首页
response = requests.get('https://ncov.dxy.cn/ncovh5/view/pneumonia')
home_page=response.content.decode()
#2.从疫情首页，提取最近一日各国疫情数据
soup = BeautifulSoup(home_page,'lxml')
script=soup.find(id='getListByCountryTypeService2true')
text=script.text
print(text)
#3.从疫情数据中，获取json格式的字符串
json_str=re.findall(r'\[.+\]',text)[0]
print(json_str)
#4.把json格式的字符串转换为python类型
last_day_corona_virus=json.loads(json_str)
#print(last_day_corona_virus)
#5.以json格式保存最近一日各国疫情数据
with open('venv/last_day_corona_virus.json','w',encoding='utf-8') as fp:
      json.dump(last_day_corona_virus,fp,ensure_ascii=False)
#获取数据-解析数据-保存数据

总结

代码运行成功，疫情首页的数据就获取并且保存了。

@白圭

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
爬虫学习日志10--获取疫情首页数据并保存完整代码

前言这篇文章主要讲述如何获取疫情首页数据并且保存。一、代码import requestsfrom bs4 import BeautifulSoupimport reimport json#1.发送请求，获取疫情首页response = requests.get('https://ncov.dxy.cn/ncovh5/view/pneumonia')home_page=response.content.decode()#2.从疫情首页，提取最近一日各国疫情数据soup = Beautif
复制链接

扫一扫