- 博客(7)
- 收藏
- 关注
原创 回归诊断
通过课上的内容,我们可以使用lm()函数拟合回归模型,通过summary()函数获取模型系数及其显著性检验结果。但是,没有任何输出告诉你这个模型适是否合适,模型是否正确依赖于它在多大程度上满足了OLS回归的假设条件。首先,我们有必要回顾一下线性回归的一系列前提假设:1.因变量与自变量之间有线性关系(线性)2.各观测值之间相互独立(独立性)3.残差服从N(0,σ^2)的正态分
2015-10-21 14:16:35 4636
转载 数据描述性分析
统计分析分为统计描述和统计推断。统计描述是通过绘制统计图、编制统计表、计算统计量等方法来描述数据的分布特征。它是数据分析的基本步骤,也是统计推断的基础。一.描述统计量已知一组试验(或观测)数据为,它可以是从所要研究的对象的总体X中取出的,这n个观测值就构成了一个样本。在某些简单的实际问题中,这n个观测值就是所要研究问题的全体。数据分析的任务是要对这全部n个数据进行分析,提取数据中包含的有用
2015-09-29 14:26:57 11149
转载 R中的列表与数据框
1.列表(list)(1)列表的构造列表是一种特别的对象集合,它的元素也由序号(下标)区分,但是各元素的类型可以是任意对象,不同元素不必是同一类型。元素本身允许时其他复杂数据类型。比如,列表的一个元素也允许是列表,例:>Lst> Lst$name[1] "Fred" $wife[1] "Mary" $no.children[1] 3 $chi
2015-09-29 14:23:34 4089
转载 R中的多维数组和矩阵
1.生成数组或矩阵数组可以看成是带多个下标的类型相同的元素的集合,常用的数值型的数组如矩阵,也可以有其他类型(字符型、逻辑型、复数型)。R可以很容易地生成和处理数组,特别是矩阵(二维数组)。数组有一个特殊的属性叫做维数向量,维数向量是一个元素取正整数值得向量,其长度是数组的维数,比如维数向量有两个元素时数组为二维数组(矩阵)。维数向量的每一个元素指定了该下标的上界,下标的下界总为1.(
2015-09-29 14:18:34 20654
转载 R中向量的下标运算
R提供了十分灵活的访问向量元素和向量子集的功能。某一个元素只要用x[i]的格式访问,其中x是一个向量名,或一个取向量值的表达式,如:> x> x[2][1] 4> (c(1,4,7)+5)[2][1] 9可以单独改变一个元素的值,如:> x[2]> x[1] 1 125 7> x[c(1,3)]> x[1] 144 125 169(1)
2015-09-29 13:54:36 6274
原创 浅谈聚类&层次聚类
浅谈聚类引言 聚类分析的目标就是在相似的基础上收集数据来分类。即聚类是我们在面对于大量数据时,所常采用的一种数据处理方式。通过,使用聚类方法有助于将原有数据进行划分,初步将其分为不同部分,提升对于数据的宏观认识,为深入理解数据打下基础。 聚类算法在工业界有着巨大的应用,如在一书中,即举Google将其应用于新闻分类的例子。近年,尤其随着机器学习的火热,聚
2015-08-16 09:41:37 18088
原创 基础假设检验
假设检验一、假设检验的基本思想运用试验结果对于一个命题的对错进行判断,假如试验结果与假设H发生矛盾就拒绝原假设H,否则就接受原假设.二、假设检验的基本步骤1、 建立假设其中表示原假设,表示备择假设.2、 选择检验统计量选择一个合适的检验统计量,使当原假设成立时,该统计量的分布完全已知。3、 选择显著性水平as由于样本的随机性,我们做出的判断并不能保证结论完全
2015-08-15 10:19:45 5065
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人