pandas基础
首先导入库,别名
pandas有两种数据结构: Series 和 DataFrame
那么怎么生成一个序列?要生成一个序列,使用的是pd.Series。记得Series首字母大写,如果要生成缺失值,可以用np.nan生成NaN值
也可以生成一组日期数据,用的是pd.date_range(),periods表示要生成日期的个数
那么如何生成一个DataFrame,感觉DataFrame用得比较多
下面的DataFrame中的index用的是上面的dates,生成一个服从正态分布的dataframe,该数据维度是6x4
也可以自定义一个范围,用的是np.arange(),reshape()表示的是生成一个几行几列的数据
也可以将字典数据转换成数据框
可以用data.dtypes查看每一列的数据类型
如果想要提取这个dataframe的列名,可以使用data.index
提取行名用的是data.columns
提取dataframe中的值用的是data.values
可以用data.describe()得到每列的描述统计信息
转置用的是data.T
如果要根据列名排序,用的是data.sort_index(axis=1,ascending=False)。axis=1表示按列,ascending=False表示降序
也可以按行排序,令axis=0就好了
也可以指定某一列进行排序,用的是by这个参数