机器学习——模型参数调优

一个模型是否适用或者效果如何很大程度上取决于超参数的设置,通过对超参数进行调优可以优化模型,提高模型性能。
超参数调优主要有以下几种方法:

1、网格搜索(grid search)

Grid search 是一种暴力的调参方法,通过遍历所有可能的参数值以获取所有所有参数组合中最优的参数组合。

如果采用较大的搜索范围以及较小的步长,网格搜索有很大概率找到全局最优值。然而,这种搜索方案十分消耗计算资源和时间,特别是需要调优的超参数比较多的时候。因此,在实际应用中,网格搜索法一般会先使用较广的搜索范围和较大的步长,来寻找全局最优值可能的位置;然后会逐渐缩小搜索范围和步长,来寻找更精确的最优值。
代码实例:
采用威斯康星乳腺癌数据进行建模分析
kaggle平台可直接获取数据:https://www.kaggle.com/uciml/breast-cancer-wisconsin-data
查看下数据的基本情况

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
data = pd.read_csv('../input/breast-cancer-wisconsin-data/data.csv')
data.head()

output:
在这里插入图片描述
其中列diagnosis代表诊断结果(M:恶性,B:良性),其余列(除Id之外)代表从每个细胞核中计算得到的相关特征。首先需要对数据进行预处理,切分出特征数据和目标变量,并对分类变量进行编码处理,由于关注结果为恶性,M:1,B:0

from sklearn.preprocessing import LabelEncoder
Encoder = LabelEncoder()
data['diagnosis'] = Encoder.fit_transform(data['diagnosis'])
data['diagnosis'].value_counts
  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值