R语言500行。
别看这是一个小文档,整个数据挖掘都以他作为基础
欲练此功,必先学习
什么叫注释,只需要一个#
###############################################
1.R语言基础
基本计算,加减乘除 +,-,*,/,>, <, == ,!=, >=,<=
3+3
100-7
4*5
22/7
355/113
3^2
log2(16)
###############################################
产生逻辑的最主要方式是比较
只能是两种TRUE,FALSE,使用时可简写为T和F
2 > 5
5 >= 3
6 < 7
2 <= 5
5 != 6
5 == 6
###############################################
数据的基本类型
常用函数class()
查看数据的属性,函数的调用是用的小括号
class(2)
class("china")
class(TRUE)
class(T)
class(FALSE)
class(F)
class(mtcars)
class(as.matrix(mtcars))
###############################################
2.数据结构
2.1向量
c(),rep(),seq()
c就是combine,合并多个元素来创建向量
rep就是replicate,重复元素,
seq就是sequence,产生序列
注意,函数的参数之间需要逗号分隔
c(1,3,6)
c("TP53","ERBB2","BRCA1")
rep(1,3)
rep("A",3)
常用操作
rep(c("control","treat"),3)
rep(c("control","treat"),each=3)
如何知道rep的功能,?
seq的几种用法
seq(1,3)
seq(5,10)
seq(5,10,2)
seq(1001,20000)
你能口算结果么?
c(rep(1,3),seq(2,5))
###############################################
2.2变量
cancergene <- c("TP53","ERBB2","BRCA1")
b <- c("zhangsan","lisi","wangermazi")
获取元素
想一下获取元素的符号[],跟小括号区别开()
b[1]
b[2]
b[2:3]
获取到的元素也可以成为新的变量
mydata <- b[2:3]
向量的长度,length
length(b)
length(mydata)
向量的命名
names(b) <- c("A","B","hello")b
###############################################
产生随机数
sample(seq(1,100), 9)
sample(seq(1,100), 9)
set.seed, 设定随机种子固定随机数,分析中用不到,教学用
如何理解set.seed
set.seed(811)
sample(seq(1,100), 9)
把产生的随机数赋值给变量myNumber
set.seed(811)
myNumber <- sample(seq(1,100), 9)
myNumber
R语言中认识的单词都是函数
max(myNumber)
min(myNumber)
sum(myNumber)
mean(myNumber)
###############################################
复习:看函数名称反应出功能
class(),
c(),
rep(),
seq(),
length(),
names(),
sample()
max()
min()
sum()
mean()