机器学习:R包与python的sklearn库中默认决策树模型的区别

本文探讨了R语言rpart包和Python sklearn库中决策树模型的区别。R语言rpart包允许用户自定义控制参数,如cp用于限制模型复杂度,防止过拟合。而Python的sklearn库中DecisionTreeRegressor默认参数会产生完全拟合的树,因min_impurity_decrease设为0,可能导致模型复杂度过高。
摘要由CSDN通过智能技术生成

R语言:

R语言可以使用rpart包实现决策树

fit3 <- rpart(Kyphosis ~ Age + Number + Start, data = kyphosis,
control = rpart.control(cp = 0.05))

其中参数control 可以自己设置,也可以使用默认参数:

#详见rpart参考pdf
rpart.control(minsplit = 20, minbucket = round(minsplit/3), cp = 0.01,
maxcompete = 4, maxsurrogate = 5
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值