通过爬取历史天气页面,对数据进行清洗,再形成折线图
一、用到的库
import datetime
from lxml import etree
import requests
import pandas as pd
二、目标网站
https://lishi.tianqi.com/beijing/202312.html
三、基础用法
# period_range的用法例子----返回固定的日期
pd.period_range(start='2017-01-01', end='2018-01-01', freq='M')
PeriodIndex(['2017-01', '2017-02', '2017-03', '2017-04', '2017-05', '2017-06',
'2017-07', '2017-08', '2017-09', '2017-10', '2017-11', '2017-12',
'2018-01'],
dtype='period[M]')
Python内置的strftime( )函数:实现本地时间\日期的格式化(将任意格式的日期字符串按要求进行格式化)
四、爬取网页
因为要获取多个月份的数据,所以用def()函数
def get_html(month):
headers={
'user-agent':'Mozilla/5.0 (Windows NT 10.0;