文章目录
1. 准备工作
1.1 数据描述
之前的数据是随机生成的,这次我们以一个真实数据集为例,即二分类数据集-乳腺癌,然后通过Pytorch实现逻辑回归达到二分类的效果。具体数据情况如下所示:
- 数据来源:sklearn.datasets.load_breast_cancer;
- 数据集形状:总计569个样本,良性357个,恶性212个,每个样本由30个属性表示,target表示肿瘤良性1还是恶性0,所有属性值均为number,详情可调用load_breast_cancer()[‘DESCR’]了解每个属性的具体含义;
- 数据集划分:随机选出20%数据作为测试集,不做验证集要求;
- 性能度量:accuracy或ROC。
1.2 设立随机化种子
为了保证每次的结果都是相同的(实验结果复现)。所以先设置好随机化种子。具体代码如下所示:
import torch
import