1、pandas.notnull():去掉空值行
pandas.isnull():只要空值行
2、数据集.列.unique():只显示不重复的指标值
3、数据集.列.value_count():统计某列各个指标的个数 并按降序排列
4、数据集.groupby(‘列’):以某列为key对其他列进行相应计算(类似于以某列分组)
5、numpy.linspace(x,y,n):产生以x为起始,以y为终止,n个元素个数
6、get_dummies(数据集['列'],prefix='列名'):one-hot编码(若离散特征的取值大小无意义,比如颜色、位置等等)把某一列具有n个属性转换成n列指标,且每个数据在n个指标中只有一个值,新列的名称以prefix为前缀再加上自身的名称