泰坦尼克乘客获救预测(代码-微改进)

#数据分析库
import pandas as pd
#科学计算库
import numpy as np
from pandas import Series,DataFrame

data_train = pd.read_csv("/home/yuan/下载/titanic_train.csv")
data_test = pd.read_csv("/home/yuan/下载/titanic_test.csv")
#这里选取的是中位数,平均数测准概率小,但是决策树的概率高。原因是?
data_train["Age"] = data_train['Age'].fillna(data_train['Age'].mean())

#线性回归
from sklearn.linear_model import LinearRegression
#训练集交叉验证,得到平均值
#from sklearn.cross_validation import KFold
from sklearn.model_selection import KFold

#Sex性别列处理:male用0,female用1
data_train.loc[data_train["Sex"] == "male","Sex"] = 1
data_train.loc[data_train["Sex"] == "female","Sex"] = 0

#缺失值用最多的S进行填充
data_train["Embarked"] = data_train["Embarked"].fillna('Q')
-- 插入 --                                                    1,1          顶端

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值