原标题:菜鸟学Python|数据分析精华文章大集合
这是菜鸟学Python的第123篇原创文章
Python的数据分析是我比较喜欢的一个方向,因为可以探索数据里面的秘密,加上可视乎会非常漂亮,但是里面也蕴含着很多技巧的综合,陆陆续续我已经写了好多这样的文章,大部分都是爬虫和数据分析,数据可视化结合的相关的文章,里面也有一些铁杆粉丝的优秀投稿的文章!今天我们来总结回顾一下~~
数据分析篇内容很丰满
1.爬虫:
从单页面的爬虫,到多页面的多线程的爬虫,然后用scrapy框架爬取,最后用selemium模拟器爬取,里面包含了一些反爬虫的策略运用,比如cookies,代理池等等.
2.数据的清洗
从基本的正则表达式,到Pandas的大量的技巧运用
3.数据的可视化
从Pandas的matplotlib,到R语言的ggplot2,再到Tableau神奇的运用
1.Python1200本书爬取
市面上Python的书这么多,出版社也很多,有很多出版社都跟我联系出书的事情,于是我把整个市面上所有的Python书都爬取了,并进行了深度分析。想知道Python那本书最火,评分最高,哪家出版社出版了Python书最多,最受欢迎,那本Python书名最长.
详细请看:
2.Python分析福利彩票
这篇文章出自粉丝“路上行舟”同学,数据分析部分我加了一点内容,福利彩票相信大家都买过,里面有没有啥秘密或者规律呢,不妨看看这篇文章。
详细请看:<