数据的筛选
data = pd.read_excel(r'D:\Anaconda\Work_file\test_data.xlsx',sheet_name=0,dtype={
'列二':str}) #注意如果dtype列中有缺失值int型会报错。
data[:10] #取前10行数据
data['列三'][:5] #取出某列前5行数据
data[['列一','列四','列三']][:5] #取出某几列前5行数据
这里的列的顺序是自己设置的,返回顺序和自己设置的顺序是一样的。
DataFrame条件查询与增删改查
data[data['列四']==138][['列二','列三','列四']] #DFname[A][B],返回列二、三、四中列四值为138的行。
data[(data['列四']==138) & (data['列五']>55)][['列五','列四']] #DFname[(A) & | ~(B)][C],或与非的条件查询
data[(data['列四'].between(150,160,inclusive=True))][['列五','列四']] #inclusive指包含给出的数值,闭区间
data[data['列二'].isin(['王\n1','李1'])][['列二','列四']] #isin主要用于判断字符串是否在某列,字符串要给全。
data[data['列二'].str.contains('王\n10','李')][['列二','列四']] #contains只能判断一个字符串,传入两个也是判断第一个。
data['列十一'] = data['列四'] * data['列五'] #添加新的一列,data['列十二'] = 'i',这种相乘是对应列每行的值相乘添加到新的列中。
data.drop('列十一',axis=1,inplace=True) #如果不加inplace是只作用于视图,axis=1是沿列方向操作。
data.drop(labels=[2,3],axis<