Pandas功能强大,在https://www.cnblogs.com/0n-the-way/p/9480268.html中,讨论了12种分析技巧,分别是:
1、在表格中,如果你想根据另一列的条件筛选当前列的值,你会怎么做?举个例子,假设我们想要一份所有未毕业但已经办理了贷款的女性清单,具体的操作是什么?在这种情况下,Boolean Indexing,也就是布尔索引能提供相应的功能。
2、Apply Function:Apply函数是使用数据和创建新变量的常用函数之一。在对DataFrame的特定行/列应用一些函数后,它会返回相应的值。这些函数既可以是默认的,也可以是用户自定义的。
3、对于替换缺失值,fillna()可以一步到位。它会用目标列的平均值/众数/中位数更新缺失值,以此达到目的。
4、Pivot Table:数据透视表根据一个或多个键聚合一张表的数据,将数据在矩形格式中排列,其中一些分组键是沿着行的,另一些是沿着列的。Python中的pandas透视表是通过本章所介绍的groupby工具以及使用分层索引的重塑操作实现的。
5、多重索引(Multi-Indexing):它有助于操作的快速执行。
6、交叉表(crosstab):数据透视表的一个特殊情况,计算的是分组中的频率。
7、合并DataFrame。
8、DataFrame排序。
9、绘图(Boxplot和直方图)。
10、Cut function for binning。
11、为nominal数据编码。
12、迭代dataframe的行。