杜凯杰教学数据分析:Logistic(逻辑回归)算法完整实例数据集建模处理,缺省值处理、类型转换、建模预测

基于病理数据集使用Logistic算法构建模型进行乳腺癌预测(良性2/恶性4)—杜凯杰

杜凯杰教学数据分析
数据来源:http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%28Original%29
实验采用 UCI 数据集中的 Wisconsin 医学院的 William H.Wolberg 博士提供的乳腺 癌 的 数
据 样 本 。所有数据来自真实临床案例,每个案例有 10 个属性。其中前九个属性是检 测指标(X值),每个属性值用 1 到 10 的整数表示, 1 表示检测指标最正常, 10 表示最不正常。 第十个属性是分类属性(Y值), 指示该肿瘤是否为恶性。

Attribute Information:

  1. Sample code number: id number
  2. Clump Thickness: 1 - 10
  3. Uniformity of Cell Size: 1 - 10
  4. Uniformity of Cell Shape: 1 - 10
  5. Marginal Adhesion: 1 - 10
  6. Single Epithelial Cell Size: 1 - 10
  7. Bare Nuclei: 1 - 10
  8. Bland Chromatin: 1 - 10
  9. Normal Nucleoli: 1 - 10
  10. Mitoses: 1 - 10
  11. Class: (2 for benign, 4 for malignant)

如果懂医疗数据的可以很方便理解这些属性代表的意义,像我这样的外行,只能通过数据来说话了………数据集数据量较少,只有569条病患的记录,我们今天就根据这些数据来建模。

加载包

import numpy as np import pandas as pd

加载数据,并添加属性标签</

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值