一、R函数
类似Linux中的命令,每个命令有特定功能。
困难之处也在于函数的数量多
R函数.png
函数必须加括号
返回值
一般函数都有返回值,但这个返回值是多种多样的
(1)返回函数结果
如ls(),列出当前环境中的对象
sys.date(),返回当前系统时间
(2)无返回结果
如rm(),直接删除指定变量,若成功则无任何反馈
(3)返回计算结果
需要清楚返回值类型,数据输出输入格式。之前所学习的数据结构,便是为此打基础。
如绘制热图的heatmap函数,输入数据必须为一个矩阵
输入数据类型:
①向量:sum、mean、sd、range、median、sort、order
②矩阵或数据框:cbind、rbind
③数字矩阵:heatmap
具体可通过help(函数)、?函数查看帮助文档
二、选项参数
R中的函数不需要全部记忆,需要了解规律
选项是质,表示选还是不选
参数是量,表示选之后选多少
1.分类
(1)选项:
①输入控制部分,往往放在第一位。
常用选项
file:接一个文件;
data:一般指要输入一个数据框
x:表示单独的一个对象,一般都是向量,也可以是矩阵或者列表;
x和y:函数需要输入两个输入变量;
x,y,z:函数需要三个输入变量;
formula:公式;
na.rm:删除缺失值
...:表示参数可传递,无数量限制
②输出控制部分
③调节部分
注意:a.根据名字判断选项作用。
color选项用来控制颜色,
select与选择,
font与字体,
font.axis坐标轴字体,
lty是line type,
lwd是line width,
method软件和算法
b.选项接受哪些参数
main 字符串,不能是向量
na.rm TRUE或FALSE
axis side参数只能是1到4
fig 包含四个元素的向量
三、数学统计函数
概率论是统计学基础,R中有许多用于处理概率,概率分布以及随机变量的函数。R对每一个概率分布都有一个简称,这个名称用于识别与分布相联系的函数。这部分涉及到很多统计学基础的理论知识,比如随机试验,样本空间,对立与互斥,随机事件与必然事件,概率密度,概率分布等。
1.R概率分布
(1)正态分布,normal distribution
d(density) 概率密度函数
p(distribution) 分布函数
q()分布函数的反函数
r(random)产生相同分布的随机数
normal
(2)离散函数
image.png
作用:需要知道每一种分布涉及到的函数,能够使用对应的函数;如果检测对应数据集,是否满足以上某种分布,如,给一个调查问卷的数据,分析其是否满足正态分布、t分布、卡方分布等,能够对其进行检验。
生成随机数
(1)runif()
#生成一个0~1的随机数
> runif(1)
[1] 0.3205146
#生成50个随机数
> runif(50)
[1] 0.72355015 0.46793629 0.13393220 0.25472876 0.60006777 0.85256370 0.39074659 0.41423505
[9] 0.47598901 0.50485926 0.51772890 0.84040754 0.46879700 0.27634808 0.07084798 0.77118456
[17] 0.50110323 0.85208682 0.45609245 0.29467533 0.42306365 0.80427433 0.43338406 0.38248442
[25] 0.16040842 0.85029125 0.18786460 0.33797916 0.35405280 0.39758621 0.15114492 0.15025011
[33] 0.58511908 0.92052279 0.35037683 0.47522564 0.79735311 0.05926597 0.87579173 0.65756016
[41] 0.93343829 0.59329111 0.63892914 0.75169320 0.18751364 0.28062113 0.64821649 0.12933464
[49] 0.41267