《Python机器学习及实践:从零开始通往Kaggle竞赛之路》第1章 简介篇 学习笔记(三)“良/恶性乳腺癌肿瘤预测”总结

本文是《Python机器学习及实践》的读书笔记,主要介绍了二分类任务——良/恶性乳腺癌肿瘤预测。内容涵盖机器学习的三个关键术语:任务、经验、性能,以及学习过程,包括数据分布观察、分类器初始化、定量样本训练和全部样本训练,最终在测试集上达到93.7%的分类准确性。
摘要由CSDN通过智能技术生成

目录

“良/恶性乳腺癌肿瘤预测”

1、机器学习的三个关键术语

(1)任务

(2)经验

(3)性能

2、机器学习的学习过程

(1)观察测试集数据分布

(2)初始化二类分类器

(3)训练定量样本

(4)训练全部样本


“良/恶性乳腺癌肿瘤预测”

1、机器学习的三个关键术语

(1)任务

“良/恶性乳腺癌肿瘤预测”的问题属于二分类任务,待预测的类别分别是良性乳腺癌肿瘤和恶性乳腺癌肿瘤。

通常使用离散的整数来代表类别,“肿瘤类型”一列列出了肿瘤的类型:0代表良性肿瘤,1代表恶性肿瘤

表1-1 威斯康星大学乳腺癌肿瘤部分数据
  肿块厚度 细胞尺寸 肿瘤类型   肿块厚度 细胞尺寸 肿瘤类型
0 1 1 0 3 8 8 0
1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值