《R语言实战》阅读笔记(一)--R语言介绍

本文介绍了R语言的基础知识,包括获取、安装及常用功能。详细解释了如何利用R进行数据分析和可视化,例如导入数据、计算均值、标准差等统计指标,并展示了如何查找帮助文档。此外,还涉及了R的工作空间管理和包的安装使用。

数据分析科学(统计学、计量心理学、计量经济学、机器学习)的发展一直与数据的爆炸式增长保持同步。
典型的数据分析步骤:
这里写图片描述

1.1 为什么要使用R

  • R可以轻松的从各种类型的数据源导入数据,包括文本文件、数据库管理系统、统计软件、乃至专门的数据仓库
  • R是免费的
  • R是一个全面的统计研究平台
  • R的可视化牛……

1.2 R的获取和安装

R可以在CRAN上(http://cran.r-project.org)免费下载。

1.3 R的使用

R是一种区分大小写的解释型语言。
一次交互会话期间的所有数据对象都被保存在内存中,一些基本函数是默认直接可用的,而其他高级函数则包含于按需加载的程序包中。
R语句由函数和赋值构成。R使用 <- 来进行赋值。
注释由符号#开头

1.3.1 几个简单函数

c():以向量的形式输入数据
mean(),sd(),cor():分别获得均值、标准差和相关度
plot():用图形展示变量之间的关系
q():退出R

1.3.2 R中的帮助文档

R中的帮助函数:
这里写图片描述

R提供了大量的帮助功能,学会如何使用这些帮助文档,毫无疑问有助于编程。可是使用?来查看某些函数的功能。

1.3.3 工作空间

  • 工作空间(workspace)就是当前R的工作环境,它存储着所有用户定义的对象(向量、矩阵、函数、数据框、列表)。在一个R会话结束时,可以将当前工作空间保存到一个镜像中,并在下次启动R时自动载入它。

  • 使用上下方向键可以查看已输入命令的历史记录

  • 可以使用函数getwd()来查看当前的工作目录;或者使用setwd()来设定当前的工作目录。如果需要读入一个不再当前工作目录下的文件,则需要在调用语句中写明完整的路径。记得使用引号闭合这些目录名和文件名;也可以使用dir.create( )来创建新目录
    用于管理R工作空间的函数如下:
    这里写图片描述

1.4 包

R提供了大量开箱即用的功能,它最激动人心的一部分功能是通过可选模块得下载和安装来实现的。目前有5500多个包,可以从 http://cran.r-project.org/web/packages下载。search()可以告诉你那些包已加载并可使用

  • 包的安装:install.packages( )
  • 包的载入:library( )

1.5 R语言编程中的常见错误

这里写图片描述

最近在写毕业论文,需要用到R语言做实验,简提单的学习一下R语言,做一些笔记。最近生活有些懈怠,对自己的要求也放松了很多,这样做不好。今天早上来实验室,在楼下看到了学部的90多岁的院士,提着一个小包,我快跑了几步,帮他开了一下门,他很有礼貌的冲我笑了一下,让人感动的是,他进门后,还用手支着门方便我进来。所以,人,不管是任何身份,不管是在任何时候,都不可以放松对自己的要求。严格要求自己总是好的,懈怠的人生没有乐趣,所以,继续加油!

R语言实战笔记第九章介绍了方差分析的内容。方差分析是种用于比较两个或多个组之间差异的统计方法。在R语言中,可以使用lm函数进行方差分析的回归拟合。lm函数的基本用法是: myfit <- lm(I(Y^(a))~x I(x^2) I(log(x)) var ... [-1],data=dataframe 其中,Y代表因变量,x代表自变量,a代表指数,var代表其他可能对模型有影响的变量。lm函数可以拟合回归模型并提供相关分析结果。 在方差分析中,还需要进行数据诊断,以确保模型的可靠性。其中几个重要的诊断包括异常观测值、离群点和高杠杆值点。异常观测值对于回归分析来说非常重要,可以通过Q-Q图和outlierTest函数来检测。离群点在Q-Q图中表示落在置信区间之外的点,需要删除后重新拟合并再次进行显著性检验。高杠杆值点是指在自变量因子空间中的离群点,可以通过帽子统计量来识别。般来说,帽子统计量高于均值的2到3倍即可标记为高杠杆值点。 此外,方差分析还需要关注正态性。可以使用car包的qqplot函数绘制Q-Q图,并通过线的位置来判断数据是否服从正态分布。落在置信区间内为优,落在置信区间之外为异常点,需要进行处理。还可以通过绘制学生化残差的直方图和密度图来评估正态性。 综上所述,R语言实战第九章介绍了方差分析及其相关的数据诊断方法,包括异常观测值、离群点、高杠杆值点和正态性检验。这些方法可以用于分析数据的可靠性和模型的适应性。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [R语言实战笔记--第八章 OLS回归分析](https://blog.csdn.net/gdyflxw/article/details/53870535)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值