python+selenium+matplotlib爬取疫情数据

from selenium import webdriver
from selenium.webdriver.common.by import By
import matplotlib.pyplot as plt
import matplotlib


def mat():
    matplotlib.rc("font",family='YouYuan')
    plt.xlabel('城市名')
    plt.ylabel('现有确诊')
    #x=plt.MultipleLocator(10)
    y=plt.MultipleLocator(10)
    ax=plt.gca()
    #ax.xaxis.set_major_locator(x)
    ax.yaxis.set_major_locator(y)
    plt.xlim((1,20))
    plt.bar(city,city_all)
    plt.show()

city=[]
city_all=[]
url='https://news.sina.cn/zt_d/yiqing0121'
#城市=//*[@id="epidemic_analysis_tbody"]/tr[{num}]/td[1]
#新增确诊_xpth=f'//*[@id="nationTable"]/table/tbody/tr[{num}]/td[2]'
#新增无症=f'//*[@id="nationTable"]/table/tbody/tr[{num}]/td[3]'
#累计确诊=f'//*[@id="nationTable"]/table/tbody/tr[{num}]/td[4]'
#风险地=f'//*[@id="nationTable"]/table/tbody/tr[{num}]/td[5]'
#//*[@id="nationTable"]/table/tbody/tr[47]/td[1]/div
web=webdriver.Chrome()
web.get(url)
更新时间=web.find_element(By.XPATH,'//*[@id="titleChinaEcharts"]/div/div[1]/span').text
with open(f'{更新时间}.txt','a+') as f:
    print(更新时间)
    f.write(f'{更新时间}\n')
    
    #总数据
    for num in range(1,13):
        name=web.find_element(By.XPATH,f'//*[@id="titleChinaEcharts"]/div/div[2]/div[{num}]/h5').text
        name_num=web.find_element(By.XPATH,f'//*[@id="titleChinaEcharts"]/div/div[2]/div[{num}]/span/b').text
        if num>=9:
            较昨日=web.find_element(By.XPATH,f'//*[@id="titleChinaEcharts"]/div/div[2]/div[{num}]/h4/code').text
            data=f'{name}:{name_num}\n    较昨日:{较昨日}\n'
        else:
            data=f'{name}:{name_num}\n'
        print(data)
        f.write(data)
    print()
    f.write('\n')
    #点击更多
    for a in range(1,5):
        web.find_element(By.XPATH,'//*[@id="epidemic_analysis_more"]').click()

    #获取数据
    for num in range(1,175,1):
        城市_区=web.find_element(By.XPATH,f'//*[@id="epidemic_analysis_tbody"]/tr[{num}]/td[1]').text
        省区市=web.find_element(By.XPATH,f'//*[@id="epidemic_analysis_tbody"]/tr[{num}]/td[2]').text
        新增=web.find_element(By.XPATH,f'//*[@id="epidemic_analysis_tbody"]/tr[{num}]/td[3]').text
        现有确诊=web.find_element(By.XPATH,f'//*[@id="epidemic_analysis_tbody"]/tr[{num}]/td[4]').text
        city.append(城市_区)
        city_all.append(现有确诊)
        data=f'省:{省区市}\n    城市(区):{城市_区}    新增:{新增}    现有确诊:{现有确诊}\n'
        print(data)
        f.write(data)
mat()
input('回车关闭')
web.close()

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值