1. python类的内置方法 http://blog.csdn.net/techml/article/details/72626519
2. Dataframe的使用方法 https://www.cnblogs.com/chaosimple/p/4153083.html
3.将时间解析成字符串 strptime格式化后,取出其中的年月日时分秒就可以构成一个新的dataframe
4.将两个dataframe合并为一个dataframe的操作包括——merge、append、join、concat
merge #连接 常用语法为
pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,
left_index=False, right_index=False, sort=True,
suffixes=('_x', '_y'), copy=True, indicator=False)
其中left为一个对象,right为一个对象,这两个对象必须要有相同的列,列的名字可以不相同.
on=None 用于显示指定列名(键名),如果该列在两个对象上的列名不同,则可以通过 left_on=None, right_on=None 来分别指定。或者想直接使用行索引作为连接键的话,就将 left_index=False, right_index=False 设为 True。
left_on:左则DataFrame中用作连接键的列名;这个参数中左右列名不相同,但代表的含义相同时非常有用。
right_on:右则DataFrame中用作 连接键的列名
left_index:使用左则DataFrame中的行索引做为连接键
right_index:使用右则DataFrame中的行索引做为连接键
sort:默认为True,将合并的数据进行排序。在大多数情况下设置为False可以提高性能
suffixes:字符串值组成的元组,用于指定当左右DataFrame存在相同列名时在列名后面附加的后缀名称,默认为('_x','_y')
copy:默认为True,总是将数据复制到数据结构中;大多数情况下设置为False可以提高性能
indicator:在 0.17.0中还增加了一个显示合并数据中来源情况;如只来自己于左边(left_only)、两者(both)
append #result= df1.append(df2)
join # result = left.join(right,on="key")
pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,
keys=None, levels=None, names=None, verify_integrity=False,
copy=True)
5.删除dataframe的某一列:drop或者del