自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

转载 干货:QQ聊天记录数据分析

如果您对某个QQ聊天群感兴趣,并想了解某段时间内大家都聊了什么话题?或者是群里哪些人最活跃?或者这些群员都在哪些时间段比较活跃?本文将教你用R实现这些问题的回答。一、下载...

2015-10-30 19:43:10 989

转载 初学ggplot2(三)

学习ggplot2近一周了,本次画几张有趣的图给大家观望一下,有误的地方还望大家纠正。一、浏览网页中无意发现一张心形图,于是动起了画心形图的冲动:#模拟数据x <-...

2015-10-28 22:40:57 153

转载 初学ggplot2(二)

在《初学ggplot2(一)》中讲解了有关qplot()函数的语法和应该,然而要更灵活地操纵几何图形与图形属性,实现“基本图形要素的自由组合”,就需要ggplot2包中更...

2015-10-26 22:55:58 250

转载 初学ggplot2(一)

翻开《ggplot2:数据分析与图形艺术》,给人一种耳目一新的感觉,它与传统的R绘图工具有本质的区别,借用黄宝臣对ggplot2的几点总结:1)ggplot2的核心理念是...

2015-10-25 20:52:00 198

转载 基于R语言的假设检验(二)

上一期文章《基于R语言的假设检验(一)》中通过参数方法对假设检验做了一下梳理,包括单样本和两样本的均值、方差假设检验。然而实际应用中并不知道总体服从何种分布,对于这类数据...

2015-10-22 23:51:23 2092

转载 基于R语言的假设检验(一)

假设检验是根据一定假设条件由样本推断总体的一种方法,该假设检验方法需要完成如下5个步骤:1)提出原假设和备择假设;2)选定置信水平alpha,一般可以是0.025,0.0...

2015-10-21 23:03:25 4076

转载 使用R语言解决半结构化数据向结构化数据的转换

网络数据时代中不仅仅产生结构化数据,同时也会产生半结构化和非结构化数据。对于半结构化和非结构化数据往往需要结构化处理,然后运用处理后的数据进行统计建模分析。本文尝试使用R...

2015-10-19 22:49:28 1003

转载 基于R语言的关联规则实现

1993年,Agrawal等人首先提出关联规则概念,同时给出了相应的挖掘算法AIS,但是性能较差。1994年,他们建立了项目集格空间理论,并依据上述两个定理,提出了著名的...

2015-10-17 18:40:18 805

转载 基于R语言的判别分析

判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。常见的判别分析方法有距离判别法、贝叶斯判别法和Fis...

2015-10-15 22:56:27 1047

转载 基于R语言的线性回归模型诊断

一、线性回归模型假设条件我们接着上篇文章《R语言下的线性回归模型》开始讲解线性模型诊断方面的操作。我们说过,线性模型的参数估计采用了最小二乘法的思想,但基于该思想是有前提...

2015-10-13 23:41:04 7388 1

转载 R语言下的线性回归模型

一、一元线性回归1、定义只考虑一个因变量和一个自变量之间的关系,其数学表达式为:其中beta0为模型的截距项,beta1为模型的回归系数,eps为模型的随机误差,一般假定...

2015-10-12 23:28:18 5813 2

转载 定性与定量的单变量正态性检验

对正态分布的检验往往具有两种方法,即从定性和定量两个角度出发。定性方法一般有直方图、Q-Q图和P-P图;定量方法一般有shapiro正态性检验和K-S正态性检验。下面将对...

2015-10-10 22:00:05 1508

转载 基于R语言的文本挖掘-分类

文本挖掘流程图:从图中可知,文本挖掘主要包含以下几个步骤:1)读取数据库或本地外部文本文件;2)文本分词;3)构建文档-条目矩阵,即文本的特征提取;4)对矩阵建立统计模型...

2015-10-09 21:41:45 1207

转载 基于R语言的数据挖掘之聚类算法--基于密度方法

前文《基于R语言的数据挖掘之聚类算法--划分方法》和《基于R语言的数据挖掘之聚类算法--层次方法》中提到这两类方法旨在发现球状簇,它们很难发现任意形状的簇。所谓非球状簇,...

2015-10-08 22:59:07 474

转载 基于R语言的数据挖掘之聚类算法--层次方法

层次聚类主要分凝聚层次聚类和分裂层次聚类,凝聚层次聚类起初将每个观测视为一类,然后根据不同的计算距离方法运用到类的合并中,不断的重复计算距离并合并,最终将所有观测聚为一类...

2015-10-02 12:28:34 1205

转载 分类变量和连续变量的相关性度量

本文主要参考《R语言实战》中第七章内容。首先来看一下分类变量的探索。R提供了多种检验类别型变量(因子)独立性的方法,主要有卡方独立性检验、Fisher精确检验和Cochr...

2015-10-01 12:37:00 35113

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除