读《python machine learning》chapt 6
Learning Best Practices for Model Evaluation and Hyperparameter Tuning
【主要内容】
(1)获得对模型评估的无偏估计
(2)诊断机器学习算法的常见问题
(3)调整机器学习模型
(4)使用不同的性能指标对评估预测模型
git源码地址 https://github.com/xuman-Amy/Model-evaluation-and-Hypamameter-tuning
【Streamlining workflows with pipeline】
【使用管道机制简化工作流程】
1、【加载数据集】
使用 Breast Cancer Wisconsin dataset数据集
# import dataset
import pandas as pd
df = pd.read_csv("G:\Machine Learning\python machine learning\python machine learning code\code\ch06\wdbc.data",header = None)
'''
column 0,1——ID 和病症(Malignant or benign
column 2-31 特征集 用于诊断病症
'''
df.head()
2、【将30个特征放入数组存储