第三章模型建立和评估--建模-课程

本章介绍如何使用机器学习中的模型搭建和评估,以泰坦尼克号数据集为例进行生存预测任务。首先,通过切割训练集和测试集进行数据准备,然后创建并训练线性模型(如逻辑回归)和树模型(如决策树、随机森林)。通过模型训练和评估,理解不同模型的性能和参数调整的影响,最后输出模型预测的分类标签和概率。
摘要由CSDN通过智能技术生成

第三章 模型搭建和评估–建模

经过前面的两章的知识点的学习,我可以对数数据的本身进行处理,比如数据本身的增删查补,还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据,我们做数据分析的目的也就是,运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。那么分析的第一步就是建模,搭建一个预测模型或者其他模型;我们从这个模型的到结果之后,我们要分析我的模型是不是足够的可靠,那我就需要评估这个模型。今天我们学习建模,下一节我们学习评估。

我们拥有的泰坦尼克号的数据集,那么我们这次的目的就是,完成泰坦尼克号存活预测这个任务。

import os
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"
import matplotlib.pyplot as plt 
import numpy as np
plt.plot(np.sin(np.linspace(0,2*np.pi, 100)))
[<matplotlib.lines.Line2D at 0x1d2f4866f70>]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5E3rsgLF-1642595471682)(output_3_1.png)]

import pandas as pd
import seaborn as sns
from IPython.display import Image
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
plt.rcParams['figure.figsize'] = (10, 6)  # 设置输出图片大小

载入这些库,如果缺少某些库,请安装他们

【思考】这些库的作用是什么呢?你需要查一查

#思考题回答


%matplotlib inline

载入我们提供清洗之后的数据(clear_data.csv),大家也将原始数据载入(train.csv),说说他们有什么不同

#写入代码
clear_data=pd.read_csv('./clear_data.csv')
clear_data


PassengerId Pclass Age SibSp Parch Fare Sex_female Sex_male Embarked_C Embarked_Q Embarked_S
0 0 3 22.000000 1 0 7.2500 0 1 0 0 1
1 1 1 38.000000 1 0 71.2833 1 0 1 0 0
2 2 3 26.000000 0 0 7.9250 1 0 0 0 1
3 3
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值