![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
R
data大柳
在大数据的海洋,一条大汉在裸泳,游得飞快(∩_∩)
展开
-
r语言熵权法求权重(真实案例完整流程)
可以通过计算熵值来判断一个事件的随机性及无序程度,也可以用熵值来判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响(权重)越大。原创 2017-12-07 20:41:29 · 38667 阅读 · 75 评论 -
r语言模糊聚类(真实案例完整流程)
模糊聚类分析是根据客观事物间的特征、亲疏程度、相似性,通过建立模糊相似关系对客观事物进行聚类的分析方法,模糊识别又称为模糊分类。从处理问题的角度来看,模糊识别可以分为有监督的分类和无监督的分类两种类型。在模糊理论中,一个元素与一个集合的关系不再是简单的属于或者不属于关系。而是属于,不属于,部分属于。原创 2018-03-23 10:57:07 · 13467 阅读 · 44 评论 -
r语言kmeans聚类(真实案例完整流程)
K-means算法简单来讲就是对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大,两个对象之间的距离越近,相似性越高原创 2018-03-21 19:09:24 · 63464 阅读 · 43 评论 -
超详细:R语言缺失值及异常值处理
缺失值缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类,分组,删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。缺失值的处理方法:对于缺失值的处理,从总体上来说分为删除存在缺失值的个案和缺失值插补。异常值指样本中的个别值,其数值明显偏离它(或他们)所属样本的其余观测值,也称异常数据,离群值。目前人们对异常值的判别与剔除主要采用物理判别法和统计判别法两种方法。原创 2018-01-26 18:09:48 · 30501 阅读 · 8 评论 -
超详细:R语言数据标准化
数据标准化(Normalization)将数据按比例缩放,使之落入一个小的特定区间。去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。原创 2018-01-26 17:20:11 · 17320 阅读 · 3 评论 -
r语言基本操作及数据处理(超详细)
基于R语言的数据清洗及处理,包括数据查看、环境设置、变量替换、数据分群等原创 2018-01-26 16:58:54 · 14107 阅读 · 2 评论 -
R语言交叉验证(详细)
k-折交叉验证k-折交叉验证(K-fold cross-validation)是交叉验证方法里一种。它是指将样本集分为k份,其中k-1份作为训练数据集,而另外的1份作为验证数据集。用验证集来验证所得分类器或者模型的错误率。一般需要循环k次,直到所有k份数据全部被选择一遍为止。原创 2018-01-23 17:09:47 · 61937 阅读 · 18 评论 -
r语言集成算法详解(超全)
随机森林、GBM、AdaBoost等集成算法的实现、对比及再组合提升原创 2017-12-07 12:18:01 · 4183 阅读 · 5 评论 -
随机森林r语言实现(超详细)
随机森林就是用随机的方式建立一个森林,森林里面有很多的决策树,并且每棵树之间是没有关联的。得到一个森林后,当有一个新的样本输入,森林中的每一棵决策树会分别进行一下判断,进行类别归类(针对分类算法),最后比较一下被判定哪一类最多,就预测该样本为哪一类。 随机森林算法有两个主要环节:决策树的生长和投票过程。随机森林有什么优缺点。R语言如何实现。原创 2017-12-25 11:49:29 · 104772 阅读 · 76 评论 -
超全:r语言离线安装包
1、R包介绍:1.1、R包(package)通常有两种: 二进制代码包(Binary package):这种包属于即得即用型(ready-to-use),但是依赖平台,比如Windows和Linux平台下不同。 源代码包(Source package): 此类包可以跨平台使用,但用之前需要处理或者编译(compiled)。同时,源代码包可以查看到程序源代码,便于查找、修改...原创 2018-07-26 12:12:08 · 19467 阅读 · 0 评论