这篇文章主要是最近整理《数据挖掘与分析》课程中的作品及课件过程中,收集了几段比较好的代码供大家学习。同时,做数据分析到后面,除非是研究算法创新的,否则越来越觉得数据非常重要,才是有价值的东西。后面的课程会慢慢讲解Python应用在Hadoop和Spark中,以及networkx数据科学等知识。
如果文章中存在错误或不足之处,还请海涵~希望文章对你有所帮助。
该系列github完整代码地址,欢迎点Star,谢谢!支持Python3.x~
- https://github.com/eastmountyxz/Python-for-Data-Mining
一. Pandas获取数据集并显示
采用Pandas对2002年~2014年的商品房价数据集作时间序列分析,从中抽取几个城市与贵阳做对比,并对贵阳商品房作出分析。

数据集位32.csv,具体值如下:(读者可直接复制)
year Beijing Chon
本文分享了Python数据挖掘课程中的实用代码,包括Pandas数据集处理,柱状图绘制,时间序列自相关图,大连交易所数据聚类分析,以及PCA降维绘图。强调数据本身在分析中的价值,并提供了相关资源链接和代码示例。
订阅专栏 解锁全文
3万+

被折叠的 条评论
为什么被折叠?



