构建基于wine数据集的svm分类模型_R语言机器学习:caret包使用及其黑箱模型解释(离散变量预测)...

本文介绍如何使用R语言的caret包构建基于wine数据集的支持向量机(svm)分类模型,并借助DALEX包进行模型解释。通过变量重要性和PDP/ALE图分析,展示了不同模型对离散变量预测的性能差异。
摘要由CSDN通过智能技术生成

作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和学术知识发现。知乎专栏:R语言数据挖掘 邮箱:huang.tian-yuan@qq.com.欢迎合作交流。

上次在

HopeR:R语言机器学习:caret包使用及其黑箱模型解释(连续变量预测)​zhuanlan.zhihu.com
zhihu-card-default.svg

中介绍了如何使用caret包建模并采用DALEX包进行模型的解释。当时是针对连续型变量进行探索,这次我们针对响应变量为离散变量(分类变量)的模型进行黑箱解释。

1 包的载入与数据导入

安装4个包。

library(pacman)
p_load(DALEX,caret,tidyverse,breakDown)

观察我们要使用的目标数据:

library(breakDown)
data(wine)
​
wine %>% as_tibble

# A tibble: 4,898 x 12
   fixed.acidity volatile.acidity citric.acid residual.sugar chlorides free.sulfur.dio~ total.sulfur.di~ density
           <dbl>            <dbl>       <dbl>          <dbl>     <dbl>            <dbl>            <dbl>   <dbl>
 1           7               0.27        0.36           20.7     0.045               45              170   1.00 
 2           6.3             0.3         0.34            1.6     0.049               14              132   0.994
 3           8.1             0.28        0.4             6.9     0.05                30               97   0.995
 4           7.2             0.23        0.32            8.5     0.058               47              186   0.996
 5           7.2             0.23        0.32            8.5     0.058               47           
  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值