随机生成一个DataFrame
import pandas as pd
df = pd.util.testing.makeDataFrame()
将特定列全部为0的行删除
df = df.loc[(df[['A', 'B', 'C']] != 0).any(axis=1)]
根据多个条件来过滤数据
df = df[(df['A']=='Male') & (df['B']==2014)]
自定义函数来过滤数据
def filter_data(row):
if row['A'] > 0 and row['B'] < 0:
return False
else:
return True
df = df[df.apply(filter_data, axis=1)]
创建一个新的列,并根据自定义函数来计算该列的值
def calculate_data(row):
return row['A'] * row['B']
df['C'] = df.apply(calculate_data, axis=1)
改变某些列的数据类型
df = df.astype({&#