写在前头
作为一个普通菜鸟,报了数据分析的选修课,也不知道从何做起,所以基本上不指望能写出一点什么,就只是先把《python数据分析与挖掘实战》这本书通读一遍,顺便以博客的形式来个云备份,不然到时候只找得到代码却忘了关键的东西就尴尬了。
虽然很多数据挖掘的教程都会从叫写爬虫开始学,但爬虫这里还是直接略过吧,毕竟看书看到scrapy-splash的时候居然还要学Lua语言也确实让人感觉心累,中间学爬虫装Ubuntu双系统也来来去去浪费了快一个月的时间,所以还是要将尽快将进入数据分析。至于获取数据这一点,京东淘宝各种各样的反爬虫和脏数据让人头疼,没有足够的硬件辅助爬东西真的是爬不动,所以还是直接在网上拿那些公开数据或者买一些过硬的数据算了。如果你只是想单纯开始数据挖掘的话,其实并不需要特地去学习怕从然后自己获取数据,谷歌百度点就可以了。