- Pandas有三种数据结构:Series、DataFrame 和Panel。
- Series 类似于数组;DataFrame 类似于表格;Panel则可以视为Excel的多表单Sheet。
- Series一维数组
- DataFrame
- 如果列名带空格,用这个格式
- 多建立一列
- 给某一个重新赋值(三种情况都相等)
- 给指定index赋值
- 深入理解Series和DataFrame
- Series
- DataFrame
- 二者区别:
- DataFrame IO操作 即读写操作
- DataFrame的Selecting and Indexing
s1 = pd.read_csv(' 某csv文件目录 ')
s1.shape # 查看有几行几列
s1.head() # 查看前几行内容
s1.head(n)
s1.iloc[ 10 : 20 , : ] # 切片 查看index 第十到二十行
s1.loc[ 15:17 , : ] # 切片 查看label 15,16,17
s1.loc[ 15:17 , : '到某列名column' ]
- Series和DataFrame的Reindexing
import numpy as np
import pandas as pd
from pandas import Series, DataFrame
- NaN
- 多级index
- Mapping 和 Replace
map可以为二维数组DataFrame添加一列,不受index影响
s1.replace ( [1,2,3] , [10,20,30] ) # 将index=1,2,3的对应value值换成了10,20,30