Serise的创建
-
Series(data, index)
-data:列表,字典,numpy数据
-index:列表,显示索引 -
属性:
shape:形状
index:索引
value:值 -
方法:
unique():去重
head():显示前几行
tail():显示后几行 -
用于判断serise里是否存在空值:
isnull()
notnull() -
数据清洗(NAN)
布尔值是可以作为Serise的索引
DataFreme的创建斜体样式
- 创建:DataFreme(data, index, columns)
data:二维列表,二维的numpy数组,字典
index:行索引
col:列索引 - 属性:
shape
index:行索引
col:列索引
values:值 - 索引:
df[‘col’]:去列
df.loc/iloc[‘index’]:取行
df.loc/iloc[行,列]:取元素 - 切片:
df[index1:index2]:切取行
df.loc/iloc[:,col1:col2]:切取列 - 方法:
pd.t_datatime(keys=df[col]):将df[col]这一列的数据类型转为时间序列
df.set_index(df[col]):表示将df[col]这一列作为df这个原数据的行索引 - df.to_csv(path):将df中的数据写入到指定的文件中
- pd.read_csv(path):将指定文件的数据读取到df中
- 一组布尔值可以作为df的行索引:df.loc[[True,False,True]]
- df[col].shift(1):将df[col]这一列的元素整体下移一位
- 数据的重新取样:(df的行索引必须是时间序列,才可以用数据取样
df.resample(‘M’).first()/last()
A表示年,M表示月,D表示日