如下图是pandas的Dataframe清洗数据步骤,包括数据行列选取,赋值,更改列名集重建索引的思维导图:
一、数据选取-普通行列总结:
df[col] # 根据列名,并以Series的形式返回列
df[[col1, col2]] # 以DataFrame形式返回多列
df.loc[‘index_one’] # 按索引选取数据
df.iloc[0] # 按位置选取数据
df.iloc[0,:] # 返回第一行v
df.iloc[0,0] # 返回第一列的第一个元素
import numpy as np
import pandas as pd
data = pd.read_csv("Y:\\DataSet\\Pandas\\311-service-requests.csv",low_memory=False)
# 1、以DataFrame形式返回多列
data[["Unique Key","Created Date","Closed Date"]]
Unique Key Created Date Closed Date
0 26589651 10/31