Decision Tree random forest important variables

The way to compute metrics that give us insight into which variables are important


To view this metric, run the following lines of R code (replace "MODEL" with the name of your random forest model):


vu = varUsed(MODEL, count=TRUE)   

vusorted = sort(vu, decreasing = FALSE, index.return = TRUE)

dotchart(vusorted$x, names(MODEL$forest$xlevels[vusorted$ix]))


 #varUsed is Variables used in a random forest, to find out which predictor variables are actually used in the random forest.


This code produces a chart that for each variable measures the number of times that variable was selected for splitting (the value on the x-axis). you can check the pic.

概率、随机变量和随机过程是概率论与数理统计学科中的重要概念。概率论是研究随机事件发生的可能性及其规律的数学分支,它通过概率分布函数(Probability Density Function,PDF)描述随机事件发生的概率分布情况。 随机变量是概率论中的一个重要概念,它是具有随机性的数值结果。随机变量可以分为离散型随机变量和连续型随机变量。对于离散型随机变量,其取值只能是有限个或可列个,概率分布可描述为概率质量函数(Probability Mass Function,PMF)。而连续型随机变量的取值可以是实数范围内的任意值,概率分布则通过概率密度函数(Probability Density Function,PDF)来描述。 随机过程是一系列随机变量的集合,它描述了随机事件随时间变化的演化规律。随机过程可以分为离散时间和连续时间两种情况。对于离散时间的随机过程,其随机变量在不同时间点上取值是离散的,可以用概率质量函数(Probability Mass Function,PMF)来描述。而对于连续时间的随机过程,随机变量取值是连续的,概率分布可以通过概率密度函数(Probability Density Function,PDF)来表示。 综上所述,概率、随机变量和随机过程之间存在紧密的联系。概率可以描述随机事件发生的可能性,随机变量则是描述随机事件的数值结果,而随机过程则涉及到随机事件随时间的演化。其中,概率分布函数(PDF)在描述随机事件发生的概率分布情况中起到了重要作用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值