未来天气爬取具体代码
爬取城市:部分城市,城市可改
爬取网站:天气网
爬取时间:2020年12月,时间可改
需要自己先行安装需要的库
需要先行将一个text文档放在D:\天气爬取里面,text文档里面应该含有城市名称对应的城市编码
具体代码如下:
import requests
from bs4 import BeautifulSoup
import csv
‘’’
获取不同城市code
‘’’
def get_citycode(city_name):
with open(‘D:\天气爬取\city.txt’, ‘r’, encoding=‘UTF-8’) as fs:
lines = fs.readlines()#一次读取整个文件内容,且自动分成一行列表,readline()每次只读取一行
for line in lines:
if(city_name in line):
code = line.split(’=’)[0].strip()#每行去掉头尾空格,且用“=”分隔出code和cityname,返回字符串列表
return code
raise ValueError(‘invalid city name’)#抛出异常
‘’’
获取不同城市7天url
‘’’
def get_7d_url(city_name):
url = ‘http://www.weather.com.cn/weather/’
code = get_citycode(city_name)
return url + code + ‘.shtml’
‘’’