第三章模型建立和评估--建模-课程

最新推荐文章于 2022-10-31 16:09:42 发布

chhdgn

最新推荐文章于 2022-10-31 16:09:42 发布

阅读量216

点赞数

文章标签：机器学习 python 数据挖掘

本文链接：https://blog.csdn.net/qq_51065211/article/details/122589234

版权

本章介绍如何使用机器学习中的模型搭建和评估，以泰坦尼克号数据集为例进行生存预测任务。首先，通过切割训练集和测试集进行数据准备，然后创建并训练线性模型（如逻辑回归）和树模型（如决策树、随机森林）。通过模型训练和评估，理解不同模型的性能和参数调整的影响，最后输出模型预测的分类标签和概率。

摘要由CSDN通过智能技术生成

第三章模型搭建和评估–建模

经过前面的两章的知识点的学习，我可以对数数据的本身进行处理，比如数据本身的增删查补，还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据，我们做数据分析的目的也就是，运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。那么分析的第一步就是建模，搭建一个预测模型或者其他模型；我们从这个模型的到结果之后，我们要分析我的模型是不是足够的可靠，那我就需要评估这个模型。今天我们学习建模，下一节我们学习评估。

我们拥有的泰坦尼克号的数据集，那么我们这次的目的就是，完成泰坦尼克号存活预测这个任务。

import os
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"
import matplotlib.pyplot as plt 
import numpy as np
plt.plot(np.sin(np.linspace(0,2*np.pi, 100)))

[<matplotlib.lines.Line2D at 0x1d2f4866f70>]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5E3rsgLF-1642595471682)(output_3_1.png)]

import pandas as pd
import seaborn as sns
from IPython.display import Image

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
plt.rcParams['figure.figsize'] = (10, 6)  # 设置输出图片大小

载入这些库，如果缺少某些库，请安装他们

【思考】这些库的作用是什么呢？你需要查一查

#思考题回答

%matplotlib inline

载入我们提供清洗之后的数据(clear_data.csv)，大家也将原始数据载入（train.csv），说说他们有什么不同

#写入代码
clear_data=pd.read_csv('./clear_data.csv')
clear_data

	PassengerId	Pclass	Age	SibSp	Parch	Fare	Sex_female	Sex_male	Embarked_C	Embarked_Q	Embarked_S
0	0	3	22.000000	1	0	7.2500	0	1	0	0	1
1	1	1	38.000000	1	0	71.2833	1	0	1	0	0
2	2	3	26.000000	0	0	7.9250	1	0	0	0	1
3	3

最低0.47元/天解锁文章

chhdgn

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

第三章模型建立和评估--建模-课程

第三章 模型搭建和评估–建模

第三章模型搭建和评估–建模