Python在数据分析领域之所以牛,很大程度上是因为Pandas这个库是在是太好用,广泛应用于数据处理、数据分析等领域。
回想起自己刚毕业那会,要做很多处理,总是自己的读取文件、筛选过滤、关联文件、聚合统计、绘制图表等等工作都是用Python原生语法实现,效率极其低下并且容易出错,当我后来接触到Pandas简直喜爱的要哭。
在Python的库中,Pandas是目前的最爱,将它的能力进行梳理:
1、直接按格式读取超多数据源的数据,比如text、json、html、mysql等;
2、对数据清洗过滤、筛选、格式转换;
3、方便的数据关联、合并、分组统计;
4、强大的时间日期处理功能;
5、无缝对接matplot画图、也能很快的转换到我喜欢的pyecharts画图;
6、快速的导出数据到mysql、excel、txt等等
7、与sklearn、tensorflow等机器学习深度学习库的方便对接;
今天在网络上发现了一张Pandas语法速记图,来自官方文档,地址在github:
https://github.com/pandas-dev/pandas/tree/master/doc
我也将其转换成了一个大图,分享给大家:
如果想要提升自己的Python水平,从基础入门到高手熟练,Pandas必定是要掌握的一个库。
欢迎大家关注我,持续分享Pandas的系列视频以及知识干货。