由于马上就研二了,选的题目是数据挖掘方向,感觉自己还是太年轻,啥都没搞明白,就胡乱的开了这个题目,这几天恶补了几篇相关文献,才弄清楚了数据挖掘流程,必须得先弄到数据(这一步看起来很SB,其实很关键),然后还得数据预处理,再经过一个挖掘算法,最后对结果进行分析。
好了,第一步呢,就是获取数据,度娘了才知道,要通过网络爬虫获取,然后呢,爬虫程序可以用很多种语言编写,有R,JAVA,Python等等,经过师兄得一番“诱导”后,我选择了Python,然后又是看各种大神得博客,搭建Python环境,学习爬虫技术,已经第三天了,有些痛苦,但我会坚持得,特此记录一下,自勉!!!