R语言学习与应用
文章平均质量分 62
zx403413599
这个作者很懒,什么都没留下…
展开
-
R语言ggplot2包之画直方图
引言ggplot2包的作图质量毋庸置疑,但是其作图语法对新手来说还是有点难度,ggplot2:数据分析与图形艺术这本书也介绍了ggplot2包的基本哲学思想和操作,个人感觉例子还不够丰富,所以对该包的用法还是停留在半瓶醋的水平。某天,突然发现一本ggplot2包的例子书,大喜,英文版名字为 R Graphics Cookbook,中文版叫做 R数据可视化手册,鉴于高昂的价格,我决定硬着头皮翻下英文版原创 2015-07-09 20:28:08 · 111982 阅读 · 4 评论 -
伍德里奇计量经济学导论之计算机操作题的R语言实现(一些重要专题)
引言本章内容介绍了多元线性回归一些好玩且实用的专题:改变自变量(因变量(对数自变量)当度量单位对因变量(自变量)、系数、t值、F值等的影响 自变量和因变量标准化以后B系数的解释对数-水平模型下,B系数当精确解读以及二次模型来表明边际递增或递减当情况调整的R方的好处以及缺点(这个倒是第一次见识)构造估计值和预测值的一个置信区间残差分析本文代码和整理好的数据见这里 此篇博客开始,每一题上原创 2015-11-29 20:25:52 · 8524 阅读 · 1 评论 -
多元统计分析上机题之R语言实现(因子分析)
引言虽然没有仔细推导书中较为繁琐的公式,但是对于以应用为主的我来说已经够了。最重要的还是了解多元统计的思想和解决问题分析步骤。 因子分析也是一种降维技术,但是它跟主成分分析又有很大不同。主成分分析主要是将多个变量线性组合为少数几个变量来表示原来绝大部分信息。而因子分析主要是寻找多个变量之间隐藏的不能观测的因子,来表示各个变量之间的相关关系。比如从高中各科成绩中通过因子分析来找到理科成绩因子、文科成原创 2015-11-01 15:40:02 · 12648 阅读 · 0 评论 -
多元统计分析上机题之R语言实现(主成分)
引言主成分分析是一门降维的技术,即将多个指标用少数几个综合指标表示出来。主成分分析可以用于变量的降维和数据的解释。 本节数据可从多元统计分析上机题之R语言实现(多元正态分布)下载。8.10data_8.10<-read.table("/home/wangjianlong/files/college/duoyuantongji/JohnsonWichern Data sets/T8-4.DAT")原创 2015-10-31 20:15:21 · 6073 阅读 · 0 评论 -
ubuntu Rstudio-server安装devtools失败
R语言安装devtools失败1.问题提示------------------------- ANTICONF ERROR ---------------------------Configuration failed because libxml-2.0 was not found. Try installing: * deb: libxml2-dev (Debian, Ubuntu, et原创 2015-11-18 17:30:34 · 5842 阅读 · 0 评论 -
伍德里奇计量经济学导论之计算机操作题的R语言实现(简单线性回归)
引言本学期正在学习伍德里奇第四版的计量经济学导论,为了增强对计量经济学的理解和熟悉R语言的操作,决定对计量经济学导论的计算机操作部分进行R语言实现,如果各位看官发现有任何错误请在下面评论,不胜感激。题目就不在博客中重复,内容主要是R语言代码和习题解答。这一系列博客主要参照了计量经济学导论习题解答、王斌会老师出的计量经济学模型及R语言应用以及Applied Econometrics with R。第四原创 2015-09-23 22:29:58 · 14721 阅读 · 0 评论 -
R语言ggplot2之图例的设置
引言图例的设置包括移除图例、改变图例的位置、改变标签的顺序、改变图例的标题等。移除图例有时候你想移除图例,使用 guides()。library(ggplot2)p <- ggplot(PlantGrowth, aes(x=group, y=weight, fill=group)) + geom_boxplot()p + guides(fill=FALSE)改变图例的位置我们可以用theme(l原创 2015-09-19 22:35:57 · 102626 阅读 · 0 评论 -
伍德里奇计量经济学导论之计算机操作题的R语言实现(多元回归:估计)
引言不知不觉,研一生活已经过去一半了,看自己现在的状态,不由得惭愧,时间管理不够好,学习没有跟上。尽量争取多写点博客,算做对自己的安慰。 本博文代码和rmd文档见下载c3.1##(1)#B2的符号最有可能为正,更高的家庭收入意味着母亲孕育更好的营养以及孕期呵护。##(2)#一方面,家庭收入的增加会增加对食物的购买,包括香烟的支出;但另一方面,高收入通常意味着有良好的教育,受教育多者吸烟数量较原创 2015-11-09 12:31:48 · 8571 阅读 · 2 评论 -
多元统计分析上机题之R语言实现(多元正态分布)
引言本学期也开了一门多元统计分析课程,也趁机想把课后上机题实现一遍,以增强理解。教材使用的是约翰逊的《多元统计分析》第六版,中英文版教材、数据集、讲义见 还参考了王斌会老师的《多元统计分析及R语言建模》本文内容主要为第4章多元正态分布的上机题,图略。 [rmd文档见](http://pan.baidu.com/s/1ntkuXQT) 可以直接用Rstudio打开(之前先安装knitr包)4.2原创 2015-10-18 16:33:07 · 23814 阅读 · 1 评论 -
R语言ggplot2包之坐标轴
引言我们还可以对图形中的坐标轴进行处理,包括x、y轴对换、设定坐标轴范围、刻度线修改与去除等等。要想对图形玩得转,坐标轴处理精通不可或缺。坐标轴对换我们使用coord_flip()函数来对换坐标轴。library(ggplot2)library(gcookbook)ggplot(PlantGrowth, aes(x=group, y=weight)) + geom_boxplot()ggplo原创 2015-08-02 17:08:49 · 112842 阅读 · 8 评论 -
R语言ggplot2包之注释
引言光光展示数据对可视化来说,远远不够。还有其他很多信息能够帮助读者解释你的数据。除了标签、坐标轴、图例外,还能够增加注释,比如强调图画的某一区域,添加描述性文本等。添加文本注释你可以在图形中添加文本,增加可读性。我们在annotate函数中设置text参数即可。library(ggplot2)library(gcookbook)p <- ggplot(faithful, aes(x=erupt原创 2015-07-22 19:53:30 · 24999 阅读 · 0 评论 -
R语言ggplot包之数据分布汇总
引言我们经常想观察一批数据的分布形态,直方图、密度图、箱线图、小提琴图和点图等都是很好的实现形式。在此,我们简略介绍直方图、密度图和箱线图,这种三种图形对我们来说更为常用。直方图很多人没搞清楚条形图和直方图之间的区别。条形图主要用于展示分类数据,即名义数据,各组分开而立。而直方图多用于展示数值型数据,各组相依。单组直方图最基本的语句就是在ggplot语句后再加geom_histogram()即可。l原创 2015-07-20 22:19:41 · 13981 阅读 · 1 评论 -
R语言ggplot2包之画散点图
引言散点图是描绘两个连续型变量之间关系的图形,特别是在观察两个变量之间的相关关系时特别好使。散点图基本操作aes中的x,y值分别表示在x,y轴的变量;geom_point表示增加三点图图层,其中的size控制点的大小,shape控制形状,一共25个,为0-25。library(gcookbook)library(ggplot2)head(heightweight)# sex ageYear原创 2015-07-13 19:53:39 · 85599 阅读 · 0 评论 -
R语言ggplot2包之画折线图
引言折线图一般用于描述一维变量随着某一连续变量变化的情况,连续变量通常为时间。换句话说,折线图最适合描述时间序列数据的变化情况。当然随着离散变量变化也是可以的,不过这个离散变量必须是有序的。画一条折线图一条基本的折线图还是比较简单的,只要在ggplot里的aes传入x,y数据且geom指定为line线即可。如果x是连续变量,直接传入即可。如果x是离散变量,此时x需要因子化,并在aes里设定group原创 2015-07-12 22:30:33 · 166594 阅读 · 6 评论 -
伍德里奇计量经济学导论之计算机操作题的R语言实现(虚拟变量)
引言前几章涉及的自变量都为定量变量,本章将讨论定性变自变量。主要内容包括: 单个虚拟变量区分两个组 g-1个虚拟变量来区分g个组 用虚拟变量来解释序数变量 虚拟变量与定量变量的交互作用,并应用邹至庄检验来检验各组是否存在显著差异 线性概率模型(本文不涉及)C7.1#(1)data_gpa1<-read.csv('/home/wangjianlong/files/pro原创 2015-11-29 15:50:13 · 10194 阅读 · 0 评论