机器学习_Logistic回归简单交叉验证

# ================ 关于泰坦尼克号乘客的生还率 ================
# 加载包
import pandas as pd
from sklearn.linear_model import LogisticRegression  # Logistic 回归模型 包
from sklearn.linear_model import LogisticRegressionCV # 带有正则化参数C的粒度
from sklearn.model_selection import cross_val_score # 交叉验证

# 文件位置
fil_tr = r"E:\python Data\happytry\Kaggle_Titanic-master\train.csv"
fil_te = r"E:\python Data\happytry\Kaggle_Titanic-master\test.csv"

# 加载数据
train = pd.read_csv(fil_tr)
test = pd.read_csv(fil_te)

# ====================================pandas预处理=================================
# 查看数据
train[:4] 
## statsmodels 和 scikit-learn通常不能接收缺失数据
train.isnull().sum()
test.isnull().sum()

# 用年龄预测生存率
## 补全缺失
train['Age'] = train['Age'].fillna(train['Age'].median())
test['Age'] = test['Age'].fillna(test['Age'].median())
## 将性别转换为 0 1变量
train['IsFemale'] = (train['Sex'] == 'female') * 1
test['IsFemale'] = (test['Sex'] == 'female') * 1
# =================================================================================

# ====================================转换成numpy进入模型============================
predictors = ['Pclass', 'IsFemale', 'Age']
## 装换为numpy array
x_train = train[predictors].values
x_test = test[predictors].values
y_train = train['Survived'].values

# ===== 创建Logistic模型 ======
model = LogisticRegression()
model.fit(x_train, y_train)
# 预测 
## 训练集预测
y_predict = model.predict(x_train)
## 测试集预测
y_predict1 = model.predict(x_test)
# 计算错误率
(train['Survived'] == y_predict).mean()

# logisticregressioncv 类用参数指定网格搜索对模型的正则化参数C的粒度
model_cv = LogisticRegressionCV(10)
model_cv.fit(x_train, y_train)

# 交叉验证带有四个不重叠训练数据的模型
model = LogisticRegression(C = 10)
scores = cross_val_score(model, x_train, y_train, cv = 4) # 做四次交叉验证

 

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Scc_hy

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值