第二章:第一节数据清洗及特征处理
重点:空值,重复值的统计
第二章:第二节数据清洗及特征处理
重点部分:
表合并的函数
concat
join
append
#表横向拼接:使用concat( ,axis=1)方法:将数据train-left-up.csv和train-right-up.csv横向axis=1合并为一张表,并保存这张表为result_up
list_up = [text_left_up,text_right_up]
result_up = pd.concat(list_up,axis=1)
result_up.head()
#concat方法:将train-left-down和train-right-down横向合并为一张表,并保存这张表为result_down。然后将上边的result_up和result_down纵向合并为result。
list_down=[text_left_down,text_right_down]
result_down = pd.concat(list_down,axis=1)
#纵向合并
result = pd.concat([result_up,result_down])
result.head()di
第二章:第三节数据重构2
重点:groupby 和agg函数,
次重点:rename和merge函数
#例子:
text.groupby('Sex').agg({'Fare': 'mean', 'Pclass': 'count'}).rename(columns=
{'Fare': 'mean_fare', 'Pclass': 'count_pclass'})
result = pd.merge(means,survived_sex,on='Sex')
result