机器学习 day03(三)

逻辑斯蒂回归

2、实战

实战二. 癌细胞数据

1. 导入数据
  1. 导入癌细胞数据集
    在这里插入图片描述
  2. data总共569条数据,每条数据30个特征
    在这里插入图片描述
2. 创建逻辑斯蒂算法模型,训练

在这里插入图片描述
查看泛化性能
在这里插入图片描述

3 创建网格搜索模型,调优

在这里插入图片描述

  1. 查看性能
    在这里插入图片描述
  2. 查看查正率,查全率,f1值
    在这里插入图片描述
    这个性能显然是不达标的
    恶性肿瘤的查正率为0.96,也就是100个人中,预测正确的只有96个,有4个本来是良性肿瘤,但却被诊断为恶性肿瘤,这个复查,查正确的可能性很大,然后虚惊一场
    但是,良性肿瘤的查全率为0.97,也就是100个人中,预测为良性正确的有97个,还有3个是恶性肿瘤,却被预测为良性肿瘤,这个是很危险的事,医学检测的准确率一定要很高,接近100%,不然后果很严重

所以,接下来要进行数据优化

4. 数据优化

首先看一下训练集数据,取一条查看
在这里插入图片描述
数据之间还是有点差距的,所以还是有必要进行数据的归一化

4.1 归一化
  1. 创建归一化模型,进行调优
    在这里插入图片描述
  2. 查看性能
    在这里插入图片描述
4.2 正则化
  1. 创建正则化模型,调优
    在这里插入图片描述
  2. 查看性能
    在这里插入图片描述
    经验准去率那么低,泛化准确率也不用看了,正则化不行
4.3 标准化
  1. 创建标准化模型,调优
    在这里插入图片描述
  2. 查看性能
    在这里插入图片描述
    经过对比,正则化后的算法模型性能最佳
5. 打包算法

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值