Pandas 库的使用
使用pandas 库必须要了解其两大数据结构 Series 和DataFrame。
主要内容:
- Series 的创建
- Series 的查询和运算
- Series 的其他功能行命令
- DataFrame 的创建
- DataFrame 的查询,合并,赋值 排序等
- DataFrame 的其他功能
一, Series 的创建方式
Note:可以将其看做是一个带有标号的以为数组,其具有行索引。
创建的方式有三种: Python 的dic 字典,numpy 中的ndarray 和具体的数值。
1,通过 python 的dic 创建
2,通过 numpy 中的narray 创建
3,通过具体的值来创建
二,Series 的常见操作
查询操作两种方式 通过绝对的位置查询和通过标签查询
三,Series 的运算操作
运算操作 + - * 、 exp和关系运算,它们都是两个的Series 对应位置的操作,在选取部分Series 进行操作的时候,一定注意index 相同,不同的位置运算为NAN。
四,Series 的其他功能运算
se.unique() 获取series数据中的数值种类
se.value_counts() 统计series数据中的数据种类以及对应数据的个数
se.mean() 计算series数据的均值
se.std() 计算series数据的标准差
se.median()计算series数据的中位数
se.max() 计算series数据的最大值
se.min() 计算series数据的最小值
se.count() 计算series数据的个数
五,DataFrame 创建
Note:可以将其看为一个二位的数组其行索引为index 列索引为columns。 一般的创建形式为: pd.DataFrame(data, columns= , index= )
五,DataFrame 赋值 排序等
DataFrame 的赋值操作
df[‘A’]=np.array([1]*len(df)) ##用数组给某列赋值
df.loc[:,[‘a’,‘c’]]=[] ##根据位置赋值
##知道如何取数,就能轻松给数据框赋值啦。
DataFrame 的排序操作
df.sort_values(by=‘column_Name’,ascending=True) ##按某列升序排序
df.sort_index(axis=1,ascending=True) ##索引排序
六,DataFrame 的其他功能:
DF.head() 查看数据框DF数据前几行
DF.tail() 查看数据库DF数据后几行
DF.info() 查看数据框DF总体信息
DF.describe() 查看数据框DF的各项统计信息
DF.index 查看数据框DF的行索引
DF.columns 查看数据框的列名
DF.shape 查看数据框的形状,行和列