引用 @这个怎么算 发表的:
1.pandas.read_csv(path)2. 可以用sklearn里面imputation 3.不懂 4.pandas groupby (‘pclass’).mean()5.pandas的先group by(‘pclass’)后选[survive==1],然后count()最后除每个pclass的总人数。如果suvive没有换成0,1,用pandas get dummy或者sklearn的 one hot coding去分类这个列 6.思路同上只不过groupby的是sex,如果sex没有换成0,1,用survive相同方法去做 7.这个是confusion matrix?汉语不知道相对应名词 8.用seaborn的barplot或者countplot画图9. sklearn 的 traintestsplit 分训练集,regressionclassifier 来训练,调用predict方法预测test set,然后有个scores来知道分数。大体的命令就这些。提一句,先把缺的值要不补全要不删除,用pandas就可以来做,然后把所有categorical的转换成one hot coding或者label。这个跟python有关但是关系不大,都是一些命令接口,不需要python很深的知识,主要是模块的用法和定义