零基础入门数据挖掘 - 心电图分类预测 建模与调参

目标

学习建模过程,并了解调参的过程。

总结

由于自身机器的原因无法对特征进行提取并做工程,以至于影响到了此次学习的代码实践。所以此次学习我主要是用自己的理解对这些建模过程和调参的流程进行重述和总结。
经过此次学习,我对模型的优化和调参有了更深刻的理解,明白了什么是调参侠。如何对模型逼近最优解,选择一个合适的模型也尤为关键。但似乎此次学习给的参数几乎是最优的了,无法对其进行更优的调参,等下次学习看是否可以提高模型效果

此次学习的文章链接

逻辑回归模型

参考链接
逻辑回归虽说是回归模型,但是做的较多的是分类任务,尤其是二分类。
在这里插入图片描述
对分类问题划分一个边界,在边界的一次可以说是一类,另一次就是不同的。逻辑回归的成功之处在于,将原本输出结果范围可以非常大的θTX 通过sigmoid函数映射到(0,1),从而完成概率的估测。而直观地在二维空间理解逻辑回归,是sigmoid函数的特性,使得判定的阈值能够映射为平面的一条判定边界,当然随着特征的复杂化,判定边界可能是多种多样的样貌,但是它能够较好地把两类样本点分隔开,解决分类问题。求解逻辑回归参数的传统方法是梯度下降,构造为凸函数的代价函数后,每次沿着偏导方向(下降速度最快方向)迈进一小部分,直至N次迭代后到达最低点。

决策树模型

参考链接
听到决策树这个名字我们很容易联想到数据结构中的二叉树模型。其实二者很类似,甚至我们可以认为决策树是基于二叉树实现的。
在这里插入图片描述
正如你所料 可视化后就是上图这种形式。
对代码层面不进行过多深究。就根据资料总结一些优点

  1. 可以可视化
  2. 数据可不预处理,对新手友好
  3. 可以同时处理数值变量和分类变量
  4. 可以处理多值输出问题
  5. 白盒模型可解释性强

缺点也是存在的

  1. 不能太过复杂,容易过拟合
  2. 容易遇到np难题
  3. 对一些文字概念难以理解
  4. 样本不均衡的情况下效果极差

集成模型

以下是较为常见的集成模型

GBDT模型
XGBoost模型
LightGBM模型
Catboost模型

对于集成模型,分成两个流派 一个是bagging 另一个是 boosting 两个流派各有千秋
采用boosting思想的模型有Adaboost, GBDT,Xgboost , lightgbm等等
两者的差别主要在与 bagging追求人人平等 而 boosting追求三六九等

接下来我们主要介绍二者的区别

  1. 样本选择上:bagging是又放回抽样,每次都是一个独立事件。而boosting方法需要每一轮的训练集不变只是对权重进行调整。
  2. 样例权重上:bagging使用均匀取样,所以每个样本的权重相等;而boosting方法会根据错误率进行实时改变。
  3. 预测函数上:也是权重方面的问题
  4. 并行计算上: Bagging方法中各个预测函数可以并行生成;而Boosting方法各个预测函数只能顺序生成,因为后一个模型参数需要前一轮模型的结果。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PyTorch是一个非常流行的开源深度学习框架,可以用于许多不同类型的任务,包括心电图(ECG)分类心电图分类是指根据患者的心电图数据来识别不同类型的心脏疾病或异常。下面是使用PyTorch进行心电图分类的一般步骤: 1. 数据准备:收集和整理心电图数据集。此数据集应包括心脏健康的样本和患有不同心脏疾病的样本。确保数据集中的样本数足够,并进行标记以表示不同的类别。 2. 数据预处理:将心电图数据转换为适合神经网络输入的格式。通常,这包括将信号进行标准化、滤波和降采样等预处理步骤。 3. 构建模型:使用PyTorch构建适合心电图分类的深度学习模型。可以选择使用卷积神经网络(CNN)来捕捉输入数据中的时域和频域特征。还可以结合使用循环神经网络(RNN)来处理时间序列数据。 4. 模型训练:将数据集分为训练集和验证集,使用训练集对构建的模型进行训练。通过定义适当的损失函数和优化器,使用反向传播算法更新模型的权重和偏置。 5. 模型评估:在训练过程中,使用验证集评估模型的性能,并根据需要进行调整和改进。评估指标可以包括准确率、精确率、召回率等。 6. 模型预测:在模型训练完成后,可以使用该模型对新的心电图数据进行分类预测。将新的数据输入训练好的模型,进行前向传播,得到分类结果。 总结来说,使用PyTorch进行心电图分类可以提供一个强大的工具来识别心脏疾病和异常。通过准备数据集、构建模型、训练和评估模型,以及进行预测,可以实现高效准确的心电图分类任务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值