在项目实训的开始阶段,通过老师给的资料对 python的各种库进行学习。也终于体会到了,python的代码简洁度。在我使用传统的JAVA思路进行思考写法的时候,例子给出了一行代码解决的方法。
在今天的数据处理中,dataframe对于数据的整理以及筛选方法让我吃惊,功能齐全并且效率高。
例如求最小值最大值
df['MonthlyIncome'].min()
df['MonthlyIncome'].max()
去掉包含空值的行
df = df.dropna(how='any')
以及loc函数对行的一些选择
#对MonthlyIncome列为空的对应DebtRatio列赋值给参数tt
tt = df.loc[df.MonthlyIncome.isnull(), 'DebtRatio']
#把预测出来的值直接赋给原来的空行
df.loc[df.MonthlyIncome.isnull(), 'MonthlyIncome_rf'] = predicts
使用判定条件直接进行选择
获得选择的行相应的序号列就能直接获得对应的行
df = df.drop(df[(df.MonthlyIncome >= 20000)].index)
对于数据的操作,这些方便的东西可以帮助我们进行数据的预处理