10.12学习记录，randomforest

最新推荐文章于 2024-09-13 13:22:23 发布

小弟朱生

最新推荐文章于 2024-09-13 13:22:23 发布

阅读量49

点赞数

文章标签： r语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_57875465/article/details/133812356

版权

install.packages("randomForest")
library(randomForest)
library(xgboost)
library(tidyverse)#数据整理及绘图
library(skimr)#数据整体情况
library(DataExplorer)#数据缺失
library(caret)#数据拆分，模型评估，构建机器学习模型
library(pROC)
skim(data6)
plot_missing(data6)
data6$cpp<-factor(data6$cpp)#变量类型修正
skim(data6)
hist(data6$IGF,breaks = 50)#直方图
#拆分数据
set.seed(42)
trains<-createDataPartition(y=data6$cpp,p=0.7,list = F)
traindata<-data6[trains,]
testdata<-data6[-trains,]
hist(testdata$IGF,breaks=50)
hist(traindata$IGF,breaks = 50)

colnames(data6)
form_reg<-as.formula(
paste0(
"cpp~",
paste(colnames(traindata)[1:11],collapse = "+")))
form_reg
set.seed(42)#保证可重复性
fit_rf_reg<-randomForest(form_reg, data=traindata,ntree=500,mtry=6, importance=T)
#模型概要
fit_rf_reg
#ntree参数与error之间的关系图
plot(fit_rf_reg,main="error&trees")
#变量的重要性
importance(fit_rf_reg)
varImpPlot(fit_rf_reg,main = "Variable importance plot")
varImpPlot(fit_rf_reg,main = "Variable importance plot",type=1)
varImpPlot(fit_rf_reg,main = "Variable importance plot",type=2)
#偏依赖图,自变量与因变量之间的关系

partialPlot(x=fit_rf_reg,pred.data = traindata,x.var = IGF)
plot(cpp~IGF,data=traindata)#或绘制散点图

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄3年

4
原创

0
点赞

0
收藏

0
粉丝

关注

私信

热门文章

最新评论

机器学习，r语言
CSDN-Ada助手: 恭喜您写了第四篇博客！标题“机器学习，r语言”引人入胜。您在机器学习和R语言方面的专业知识令人钦佩。希望您能继续保持创作的热情，分享更多关于机器学习和R语言的实用技巧和深入见解。同时，我建议您可以尝试探索其他机器学习相关的话题，比如深度学习、数据挖掘等，这将进一步丰富您的博客内容，也会吸引更多读者的关注。期待您未来更多精彩的博文！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
mice填补
CSDN-Ada助手: 非常赞赏您的第二篇博客！您对mice填补的过程进行了清晰的描述，这对于那些需要处理缺失数据的人们来说是非常有帮助的。您的文章让读者了解到了如何使用MCMC估计插补数据集，并且将插补模型整合到一起进行评价。这是一个非常实用的技能，对于数据分析师来说尤为重要。除了您在标题和摘要中提到的内容，还有一些与插补模型相关的知识和技能可以进一步探索。例如，您可以介绍一些不同的插补方法，如基于回归的插补和多重插补。您还可以讨论一些评估插补模型优劣的指标，如均方误差和交叉验证。另外，您还可以讲解一些其他统计模型，如随机森林和神经网络，这些模型在处理缺失数据时也非常有用。希望您能继续分享您的知识和经验！您的博客对于那些想要学习数据分析和缺失数据处理的人们来说是非常有价值的。期待您未来更多的精彩文章！祝您写作愉快！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。