一、背景说明:
今早在网易云课堂学习了一节关于“python爬取中国银行外汇牌价”课程,但视频中还未提及到如何将爬取的数据存入到excel中,鉴于自己的历史习惯,网上爬取的表格总是喜欢存入到excel中,于是有了以下的内容。
name=[]
xianchao_sell_price=[]
date_waihui=[]
time_waihui=[]
for i in range(0,10):
#这个网址的第一页跟其他页的格式稍微有区别,于是做了以下的判断。
if i==0:
url=urlopen('http://www.boc.cn/sourcedb/whpj/')
else:
url=urlopen('http://www.boc.cn/sourcedb/whpj/index_{}.html'.format(i))
c=url.read()
bs_obj=BeautifulSoup(c,features='lxml')
t=bs_obj.find_all('table')[1]
all_tr=t.find_all('tr')
all_tr.pop(0)
for r in all_tr:
all_td=r.find_all('td')
name.append(all_td[0].text)
xianchao_sell_price.append(all_td[4].text)
date_waihui.append(all_td[6].text)
time_waihui.append(all_td[7].text)
#我抓取现钞外汇卖出价,假如还想抓取其他字段的话,新增空列表再append就可以。
test = pd.DataFrame({'货币名称':name,'卖出价':xianchao_sell_price,'发布日期':date_waihui,'发布时间':time_waihui})
test.to_excel(r'C:\学习资料\waihui.xlsx')