数据分析
文章平均质量分 61
志愿君
这个作者很懒,什么都没留下…
展开
-
衡量回归模型的效果--R语言实现
当预测变量是数值型变量时,我们通常会选择一些准确性的度量方法来评估模型的有效性,接下来我们总结了一些度量标准,并写出用R语言实现代码: 1、均方根误差(root mean squared error,RMSE) 2、均方误差(mean aquared error,MSE)3 、R^2 =r^2 表示数据中包含的信息中能被模型解释的比例 R^2原创 2017-03-18 21:41:04 · 6171 阅读 · 0 评论 -
R语言col参数值对应的颜色条形图
绘制图形时,我们经常会给图形设定相应的颜色,通过保留下面的关于颜色的条形图,我们就可以很轻松的知道相应的col参数值所对应得具体颜色pdf("colors-bar.pdf",heigh=120)par(mar=c(0,10,3,0)+0.1,yaxs="i")barplot(rep(1:length(colors())),col=rev(colors()), name原创 2017-04-04 21:27:15 · 22736 阅读 · 1 评论 -
随机森林
一、随机森林算法介绍 1、选择模型的数目m(即简单决策树的个数);2、对i=1到m执行 3、从原始数据中生成一个bootstrap样本4、在该样本上生成一个数模型5、对每个分裂点执行 6、随机抽取k(7、在这k个解释变量中选择能用于划分数据的最优变量8、终止 9、使用通常的终止树模型的规则绝定何时让树停止生长(不要修建) 终止随机森林算法的调优参数:1、原创 2017-04-01 12:27:24 · 486 阅读 · 0 评论 -
决策树算法汇总
决策树算法汇总原创 2017-03-31 12:44:50 · 1392 阅读 · 0 评论 -
线性分类模型
线性分类模型二、线性判别分析(LDA) 线性判别分析的原理可以追溯到Fisher和Welch。两位学者从不同的角度分析了获得最优判别准则的方法。接下来,本文将分别介绍这两种方法。1.Welch 使用最小化误判率的角度获取最优判别准则原创 2017-03-30 23:53:50 · 598 阅读 · 0 评论 -
R语言的基本对象
R语言的基本操作对象原创 2017-04-09 15:24:25 · 1723 阅读 · 0 评论 -
R语言之程序的流程控制
1.if 语句1.1 if语句的基本格式if(逻辑表达式){系列运算命令}如果if语句所执行的命令只有一行时可以省略大括号eg1:假设1度电费是50元,为了鼓励节约资源,如果一个月使用超过200度,电费将再加收总价的15%,如果电费小于1元,以四舍五入处理。myfunction1 {energyPrice=deg*price i原创 2017-04-08 15:45:46 · 3103 阅读 · 0 评论 -
分类模型的效果度量---R语言实现
分类模型的效果度量---R语言实现之前我们介绍了连续型响应变量模型的评估方法(有包括RMSE,R^2之类的评估指标),这次我们介绍一下分类型响应变量模型的评估方法。目 录一、分类模型介绍二、混淆矩阵三.接受者操作特征(ROC)曲线四、提升图五、R语言实现 一、分类模型介绍 分类模型一般产生两种类型的预测。和回归模型类似,分类模型产生一个连续数值原创 2017-03-29 14:48:40 · 5268 阅读 · 0 评论 -
机器学习之——线性回归模型及其扩展
其中:表示数值型相应变量对于第i 个观测值的取值,代表截距项,代表第j个变量的系数,代表第j个预测变量对于第i个观测值的取值,代表模型无法解释道额随机误差。一、线性回归普通线性回归的目标是求出能最小化响应变量观测值与预测值之间的误差平方和(SSE)其中:是结果变量,是这一观测的结果变量的预原创 2017-03-23 16:56:00 · 1764 阅读 · 0 评论 -
置换检验(R语言实现)
显著性检验通常可以告诉我们一个观测值是否是有效的,例如检测两组样本均值差异的假设检验可以告诉我们这两组样本的均值是否相等(或者那个均值更 大)。我们在实验中经常会因为各种问题(时间、经费、人力、物力)得到一些小样本结果,如果我们想知道这些小样本结果的总体是什么样子的,就需要用到置换检验。 Permutation test 置换检验是 Fisher于20世纪30年代提出的一种基于大量转载 2017-04-07 10:39:16 · 7266 阅读 · 0 评论 -
Python 工具和库整理
管理 Python 版本和环境的工具p – 非常简单的交互式 python 版本管理工具。 pyenv – 简单的 Python 版本管理工具。 Vex – 可以在虚拟环境中执行命令。 virtualenv – 创建独立 Python 环境的工具。 virtualenvwrapper- virtualenv 的一组扩展。包管理管理包和依赖的工具。 pi...原创 2018-03-02 17:01:10 · 2211 阅读 · 0 评论