最近在学习优达学院的一门机器学习的课程,主要讲解利用机器学习分析股票数据,然后。课程网址在这里:https://classroom.udacity.com/courses/ud501
所以需要大量的股票数据,我就先百度了一下,发现网易财经的数据很全,暴露的也很好,所以的数据都是放在一个<table>标签中,
所以我就决定爬网易财经了,开始着手写爬虫。
首先,是构造url。
假如我要查询中国石油(601857)的2016年度的第三季度的交易数据,url是这样的。
http://quotes.money.163.com/trade/lsjysj_601857.html?year=2016&season=3
我们发现,这段url有3个参数,股票的代码601857,年度2016,季度3
只要