第三章模型建立和评估

最新推荐文章于 2023-12-08 10:24:14 发布

zdtattoo

最新推荐文章于 2023-12-08 10:24:14 发布

阅读量216

点赞数

分类专栏：动手学数据分析文章标签： python 机器学习开发语言

本文链接：https://blog.csdn.net/zdtattoo/article/details/126519303

版权

动手学数据分析专栏收录该内容

3 篇文章 0 订阅

订阅专栏

这章的内容特别难，感觉涉及到了统计建模的专业知识（额，那我不是统计系的么？whatever，都忘了反正）。把一些重点记录如下：

1. 选择什么模型

2. 这里使用留出法划分数据集

将数据集分为自变量和因变量
按比例切割训练集和测试集(一般测试集的比例有30%、25%、20%、15%和10%)
使用分层抽样
设置随机种子以便结果能复现

3. 模型评估

模型评估是为了知道模型的泛化能力。
交叉验证（cross-validation）是一种评估泛化性能的统计学方法，它比单次划分训练集和测试集的方法更加稳定、全面。
在交叉验证中，数据被多次划分，并且需要训练多个模型。
最常用的交叉验证是 k 折交叉验证（k-fold cross-validation），其中 k 是由用户指定的数字，通常取 5 或 10。
准确率（precision）度量的是被预测为正例的样本中有多少是真正的正例
召回率（recall）度量的是正类样本中有多少被预测为正类
f-分数是准确率与召回率的调和平均

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zdtattoo

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
第三章模型建立和评估

第三章模型建立和评估
复制链接

扫一扫

专栏目录

模型建立和评估

m0_52893371的博客

06-24

303

前言：经过前面的两章的知识点的学习，我可以对数数据的本身进行处理，比如数据本身的增删查补，还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据，我们做数据分析的目的也就是，运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。那么分析的第一步就是建模，搭建一个预测模型或者其他模型；我们从这个模型的到结果之后，我们要分析我的模型是不是足够的可靠，那我就需要评估这个模型。今天我们学习建模，下一节我们学习评估。我们拥有的泰坦尼克号的数据集，那么我们这次的目

第三章：模型建立和评估

QAZMLPqazmlp123的博客

07-22

956

第三章 模型搭建和评估–建模经过前面的两章的知识点的学习，我可以对数数据的本身进行处理，比如数据本身的增删查补，还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据，我们做数据分析的目的也就是，运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。那么分析的第一步就是建模，搭建一个预测模型或者其他模型；我们从这个模型的到结果之后，我们要分析我的模型是不是足够的可靠，那我就需要评估这个模型。今天我们学习建模，下一节我们学习评估。我们拥有的泰坦尼克号的数

参与评论您还未登录，请先登录后发表或查看评论

动手学数据分析–Task05：数据建模及模型评估

qq_35098624的博客

08-26

304

动手学数据分析–Task05：数据建模及模型评估

datawhale课程[动手学数据分析]——Task05：模型搭建与评价

sd3145265的博客

08-27

509

目录第三章 模型搭建和评估--建模模型搭建任务一：切割训练集和测试集任务提示1任务二：模型创建提示任务三：输出模型预测结果提示3第三章模型搭建和评估-评估模型评估任务一：交叉验证提示4思考4任务二：混淆矩阵提示5任务三：ROC曲线提示6思考6 第三章 模型搭建和评估–建模经过前面的两章的知识点的学习，我可以对数数据的本身进行处理，比如数据本身的增删查补，还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据，我们做数据分析的目的也就是，运用我们的数据以及结合

动手学数据分析 Task05：数据建模及模型评估

RexT1的博客

08-28

368

文章目录动手学数据分析Task05：数据建模及模型评估一、重点与思考动手学数据分析本次跟随Datawhale组织的动手学数据分析组队学习，对数据分析继续加强学习，希望能有所收获。Datawhale是一个很好的开源组织，会组织很多优质、开源的系列学习。附上本次组队学习的计划和教程资料，如果链接失效，可点击这里前往Datawhale官网自行查找，即使没有当时加入组队学习，有兴趣的话从现在开始学习也不晚哦~ 由于此次是需要有一些pandas基础，之前有做过pandas的脑图总结，有需要的同学可以点这里前往获

模型评估

CangHaier的博客

06-10

517

模型评估一、回归任务最常用的性能度量是均方误差二、分类任务常用的性能度量指标1）错误率：分类错误的占总样本的比例精度分类正确的占总样本的比例错误率+精度 = 1 2）查准率Precision——分类为正的样本中真正的正样本的比例查全率Recall——在所有正样本中被正确分为正样本的样本的比例3）P-R曲线——查准率与查全率关系曲线绘图方式：对学习器的概率结果排序，按照概率从大到小，逐个把...

泰坦尼克号 第三章 模型搭建和评估

Joe的博客

03-25

2596

软件项目管理第3章-生存期模型PPT课件.ppt

11-15

本章主要探讨了不同类型的生存期模型，并通过案例分析和思考题帮助理解它们的应用场景。 1. 生存期模型定义：生存期模型是软件开发过程的一种结构化表示，它界定了从需求收集到最终产品交付的各个阶段，包括需求...

第三章 线性模型1

08-03

线性模型是预测分析和机器学习的基础工具，它通过建立输入变量（特征）与输出变量（响应变量）之间的线性关系来进行预测。下面我们将详细阐述线性模型的相关知识点。首先，3.1部分介绍了线性模型的基本概念。线性...

第9章. 模型校准：评估性能

最新发布

weixin_44259522的博客

12-08

1303

地下水模型的建立将会非常直接，如果我们能够完美地表征自然界。然后，边界和参数的分配将涵盖所有相关的空间和时间信息，并且模型将完全模拟真实的地下水系统。然而，地下水系统从来都不是完全已知的，我们必须将这个系统映射到一个模型空间中，而不是反映环境系统本身（Beven, 2009, p. 11）。这里使用模型空间来定义对于一个现场而言可能适用的合理模型和模型输入的范围。在进行这种映射的过程中，由概念模型表示的自然界的简化视图已经被进一步简化，以便数值模型能够进行计算。

模型建立与评估

weixin_30614109的博客

06-23

170

一.基本概述回归指标：均方误差分类指标：准确率、召回率、精度、错误率排序指标：二、分类指标（一）准确率、召回率、精度、错误率（二分类）准确率/查准率（precision）: 是针对预测为正的样本来说的，指的是预测为正的样本中预测正确了的百分比。 TPTP+FP 召回率/查全率（recall）：是针对真实为正的所有样本来说的，指的是所有为正的样本...

模型的建立与评估

weixin_43595036的博客

09-23

728

模型的建立与评估 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签 plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号 plt.rcParams['figur

第三章 模型建立及评估

qq_45726627的博客

01-20

1032

目标：根据泰坦尼克号的数据集完成泰坦尼克号存活预测。 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from IPython.display import Image plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签 plt.rcParams['axes.unicode_minus'] = Fal

数据分析（五）模型建立与评估

xpwmiracle的博客

06-22

1252

完工

动手学数据分析第三章模型建立和评估--建模

L1315382539的博客

08-26

872

动手学数据分析 | 模型建立与评估(五)

qq_40857571的博客

05-26

998

接上篇动手学数据分析 | 数据可视化(四)。经过前面的学习，可以对数据本身进行增删查补、清理等处理，那么下面就要开始使用处理好的数据，数据分析的目的也就是运用数据以及结合业务来得到某些结果。分析的第一步就是建模，搭建一个预测模型或者其他模型；得到模型结果后，要分析模型是不是足够可靠，即进行模型评估。针对泰坦尼克号数据集，数据分析目的就是完成泰坦尼克号存活预测的任务。目录一、建立模型 1.切割训练集和测试集 2.模型创建 3.输出模型预测结果二、模型评估 1.交叉验证 2.混淆矩阵.

动手学数据分析5-数据建模及模型评估

coldfish的博客

06-22

1088

数据建模及模型评估数据分析的目的就是，运用数据结合业务来得到得到或评估我们需要知道的结果。经过前面的学习，我们学会了数据清洗，可视化等操作。下面我们来进行数据建模，搭建一个预测模型或者其他模型，从这个模型的到结果，我们还要分析模型是不是足够的可靠，也就是评估这个模型。我们利用泰坦尼克号的数据集，来完成泰坦尼克号存活预测任务。数据建模 # 读取原数据数集 train = pd.read_csv('train.csv') train.shape 我们利用前面数据清洗的方法对原始数据进行清洗去除无用的

kaggle泰坦尼克数据之模型建立和评估

qq_36226141的博客

06-21

756

三种模型评估方法

qq_40459275的博客

02-10

1713

1、留出法直接将数据集划分为两个互斥数据集合。（训练集+测试集） 2、交叉验证法将数据集分为k个大小相同或相似的子集，每次使用k-1个子集的并集作为训练集，剩余自己作为测试级，如下图所示： 3、自助法（常用于样本较少时）从原始数据中采样得到有效的训练集，同理得到测试集。 ...

数据挖掘：第四章——模型建立与分类算法详解

在第四章的PPT中，讲解的是数据挖掘中的一个重要环节——分类过程，特别是建立模型阶段。分类在数据挖掘中占据核心位置，它是通过学习数据集来创建预测模型，用于预测新样本所属的类别。这一章详细介绍了几种常见的...