1,如果有些列用不到了,用drop([列名],axis=1)去掉,别用del。
2,groupby后的对象是一个个的DataFrame,虽然不能print出来,但是可以使用apply方法,此时的apply传入的参数x就是一个个的DataFrame。
3,DataFrame需要有多个约束条件的时候,不能用and,可以用多个[],
例如:temp3[temp3.Final_in_ZD190 == 1][temp3['管外'] == 1]
4,如果apply用到的函数需要额外的参数,用元组的格式传给args,如果有1个a的话就用(a,),例如:apply(dobias,args=(1,)),但是groupby的apply要这样:apply(dobias,1)
5,DataFrame.info() 查看各个列的类型、空值等信息。
6,DataFrame的filter方法是个选择特征列好方法,可以用正则表达式匹配需要选择的列。
7,使用 DataFrame.dtypes 可以查看每列的数据类型,Pandas默认可以读出int和float64,其它的都处理为object,需要转换格式的一般为日期时间。DataFrame.astype() 方法可对整个DataFrame或某一列进行数据格式转换,支持Python和NumPy的数据类型。
8,取不为空的值用notnull()方法,取空值用isnull()方法。
9,corr方法可以算相关度
10,填充的方法,前向和后向
11,apply有axis参数,设为1就能在lambda中使用ix等方法了