【大数据专业】机器学习之分类模型的网格搜索

学习目标:

通过使用jupyter notebook学会机器学习中分类模型的评估和优化的其中一种方法:
【网格搜索】

实验步骤:

1、导入相应的分类模型的评估与优化的库并进行实例化

#网格搜索就是调参的工具
from sklearn import svm
from sklearn import datasets
from sklearn.model_selection import GridSearchCV
import pandas as pd
iris = datasets.load_iris()
parrameters = {'kernel':('linear','rbf'),'C':[1,10]}
svc = svm.SVC(probability = True)
clf = GridSearchCV(svc,parrameters)
clf.fit(iris.data,iris.target)

结果为:

GridSearchCV(estimator=SVC(probability=True),
             param_grid={'C': [1, 10], 'kernel': ('linear', 'rbf')})

【注】decision_ function返回数据点属于每个类别的判定系数,若为正数,则代表该点属于这一类,负数则表示该点不属于这一类。判定系数的绝对值越大,判断的可信度越高。

2、导入SVC库

from sklearn.svm import SVC
clf.cv_results_

显示为:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3、显示所有拟合模型的参数设定

pd.DataFrame(clf.cv_results_)

结果为:
在这里插入图片描述
在这里插入图片描述

clf.best_params_

结果为:

{'C': 1, 'kernel': 'linear'}

4、显示数据

print(clf.decision_function(iris.data))

结果为:

在这里插入图片描述
(仅显示部分数据,一切以实验为准)

5、导入相应的库

import scipy.stats as stats
from sklearn import datasets
from sklearn.model_selection import RandomizedSearchCV
import pandas as pd
from sklearn.svm import SVC

6、导入鸢尾花数据集并设定参数

iris = datasets.load_iris()
parameters = {'kernel':('linear','rbf'),
             'C':stats.expon(scale=100),
             'gamma':stats.expon(scale = .1),
             'class_weight':('balanced',None)}

实例化:

svc = SVC()
clf = RandomizedSearchCV(svc,parrameters)
clf.fit(iris.data,iris.target)

结果为:

RandomizedSearchCV(estimator=SVC(),
                   param_distributions={'C': [1, 10],
                                        'kernel': ('linear', 'rbf')})
pd.DataFrame(clf.cv_results_)

结果显示为:
在这里插入图片描述
在这里插入图片描述

clf.best_params_

结果为:

{'kernel': 'linear', 'C': 1}
  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值