数据处理基础
Numpy:数值运算
数组的创建
数组的索引与变换
numpy.flatten()返回一份拷贝,对拷贝所做的修改不会影响原始矩阵。
numpy.ravel()返回的是视图,会影响原始矩阵。
数组的组合
数组的统计函数
Pandas:表格处理
Series数据结构
数据结构:DataFrame
- 获取数据框的行数、列数和维数:df.shape[0]或len(df)、df.shape[1]、df.shape。
- 获取数据框的列名和行名:df.columns、df.index。
- 重新定义列名:df.columns=[‘X’,‘Y’,‘Z’]
- 重新更改某列的列名:df.rename(columns={‘x’:‘X’},inplace=True)。注意,如果缺失inplace选项,则不会更改,而是增加新的列。
- 观察数据框的内容
- df.info():info属性表示打印DataFrame的属性信息。
- df.head():查看前五行的数据信息。
- df.tail():查看后五行的数据信息。
创建空数据框:df_empty = pd.DataFrame(columns=[‘x’,‘y’,‘z’])