- df假设是我们要进行计算的data frame。
- 有些是函数,比如说pd.isnull(),而有些是methods,比如说df.drop()。
- df.drop():删除行或者列。这样生成一个新的data frame,但可以设置参数,选择是否在原df也删除行或者列。axis=1表示,删除的是列;默认不改变原来的df,但是加上inplace = True会删除在原df中的行或者列。
- df.shift(i):表示df数据都往下移i个位置。
- pd.isnull(df):判断是否为0.
- df.sum():计算和,如果是空白或者0,列上面和,如果是1,计算每个行的和。
- len(df):返回行的数量。
- df.index 返回行名或者index。
- df.columns返回列名。
- 生成空的df,同时确定行和列名(行列数也确定):df = pd.DataFrame(index = ["a","b,"c"], columns = ["1","2","3","4"])。
- 在已生成的df中加入行或者列:df.loc["newRow",:] = []。可以直接使用list,也可以是pd.Series。
- df.std()返回的是无偏差的unbiased标准差。
- 建立空的df:通过np包建立,df = pd.DataFrame(np.zeros([nRows, nColumns]))
- 索引:
- 行名索引行:df.loc["rowName"]或df.loc["rowName",:]
- 列名索引列:df["columnName"]或df.loc[:,"columnName"]
- 行号索引行:df.iloc[rowNum,:]
- 列号索引列:df.iloc[:,columnNum]
- 可以使用range或者行名和列名的list索引多个行和多个列
- 不能用名字和号码同时索引行或列,去索引某个准确位置的element