第三章模型搭建和评估--建模

最新推荐文章于 2022-10-09 22:27:51 发布

独孤燎原

最新推荐文章于 2022-10-09 22:27:51 发布

阅读量269

点赞数

文章标签：机器学习 python 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haozhengwei81/article/details/124904642

版权

本文介绍了如何在Python中使用sklearn库搭建和评估机器学习模型。首先，加载并比较了'clear_data.csv'和'train.csv'数据集，接着切分数据为训练集和测试集。然后，创建了逻辑回归和随机森林模型，展示了不同参数设置对模型性能的影响，并给出了训练集和测试集的得分。

摘要由CSDN通过智能技术生成

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from IPython.display import Image

%matplotlib inline

plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
plt.rcParams['figure.figsize'] = (10, 6) # 设置输出图片大小

载入我们提供清洗之后的数据(clear_data.csv)，大家也将原始数据载入（train.csv），说说他们有什么不同

data = pd.read_csv('clear_data.csv')
train = pd.read_csv('train.csv')
data.shape, train.shape

data.head(5)

train.head(5)

任务一：切割训练集和测试集

x = data
y = train['Survived']

from sklearn.model_selection import train_test_split

train_test_split?

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.33, stratify = y, random_state

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。