python爬虫小组作业
上周布置了python的小组作业,每一组要求爬取老师指定的信息,本组抽到的题目如下:
从中国银行网址:http://www.boc.cn/sourcedb/whpj/ 获取主要外汇(美元、欧元、英镑、加拿大元、澳大利亚元、日元、韩元、新台币、澳门元和港币)的牌价信息,计算出它们的每天平均价。要求把今年5月份每天平均价格保存到Excel文件中,每种外汇的数据保存在一个工作表中,并画出汇率变化的折线图。
我负责的是爬虫的部分.
先把代码贴上:
import urllib
from urllib import request, parse
from bs4 import BeautifulSoup
import xlwt
def main():
Currency_name = input("请输入你要查找的货币名称:") # 可以输入你想查找的货币名称
url = "https://srh.bankofchina.com/search/whpj/search_cn.jsp" # 目标网址
# 1.爬取网页
datalist = getDate(url, Currency_name)
savepath = str(Currency_name + "牌价信息.xls") # 保存路径
# 2.保存数据
saveDate(datalist, savepath)
# 1.爬取页面
def getDate(url, Currency_name):
# 创建数据集合
datalist = [] # 此数组储存每一个时间段的数据的数组
for i in range(2, 162): # 页数
html = askURL(url, i, Currency_name) # 得到html数据
# 2.逐一解析数据
soup = BeautifulSoup(html, 'html.parser')
div = soup.find('div'