【数据分析入门】R语言数据类型及常见语句整理

一、向量、标量

x<-c(1,2,3,4,5)
##1-100
c(1:100)
##等差数列,间隔2
seq(from=1,to=100,by=2)
##输出10个数
seq(from=1,to=100,length.out=10)
##重复向量
rep(2,4)
rep(x,3)
##筛选数据
x[x>3]
x[c(4:18)]
x[c(T,F)]
##增加元素
append(x=v,values=99,after=5)
##求余
y%%x
##整除
y%/%x
##是否包含
c(1,2,3) %in% c(1,2,3,4,5,6)

##向量运算的函数
##数学函数
abs(x)
sqrt(x)
log(16,base=2)
#默认以e为底
log(16)
log10(10)
exp(x)
##向上取整
ceiling(c(-2.3,3.1415))
##向下取整
floor(c(-2.3,3.1415))
##返回整数部分
trunc(c(-2.3,3.1415))
##四舍五入
round(c(-2.3,3.1415))
round(c(-2.3,3.1415),digits=2)
##三角函数
sin(x)
cos(x)
##统计函数
sum(x)
max(x)
min(x)
##返回最大值和最小值
range(x)
mean(x)
##方差
var(x)
##标准差
sd(x)
##连乘
prod(x)
median(x)
quantile(x)
quantile(x,c(0.4,0.5,0.8))
##最大值的索引值
which.max(x)
which.min(x)

二、矩阵与数组

m<-matrix(1:20,4,5)
##按行排列
m<-matrix(1:20,4,byrow=T)
##按列排列
m<-matrix(1:20,4,byrow=F)
##rnames是行名,cnames是列名
dimnames(m)<-list(rnames,cnames)
dim(x)<-c(4,5)
dim1<-c("A1","A2")
dim2<-c("B1","B2","B3")
dim3<-c("C1","C2","C3","C4")
x<-array(1:24,c(2,3,4),dimnames=list(dim1,dim2,dim3))
state.x77[,"Income"]
state.x77["Alabama",]

##数学运算
rowSums(m)
colSums(m)
colMeans(m)
rowMeans(m)
n<-matrix(1:9,3,3)
t<-matrix(2:10,3,3)
##矩阵内积
n*t
##矩阵外积
n %*% t
#返回对角元素
diag(n)


三、列表

state.center
##创建
a<-1:20
b<-matrix(1:20,4)
c<-mtcars
d<-"this test"
mlist <-list(first=a,second=b,third=c,forth=d)
##访问元素
mlist[c[1,4]]
##返回的仍是列表
mlist$first
state.center$x
##返回的是本身的数据类型
mlist[[1]]


四、数据框

data.frame
##取一列
state$Murder
##画散点图
plot(women$height,women$weight)
##线性回归
lm(formula=weight~height,data=women)
##快速的help方法
?attach
##attch加载数据框到搜索目录中,直接敲列名,而不需要使用$
attach(mtcars)
mpg
detach(mtcars)


五、因子

table(mtcars$cyl)
table(mtcars$am)
##定义因子
f<-factor(c("red","red","green","green","blue"))
##散点图
plot(mtcars$cyl)

在这里插入图片描述

plot(factor(mtcars$cyl))

在这里插入图片描述

六、时间序列

airmiles

在这里插入图片描述

sys.Date()
class(sys.Date())
a<-"2022-04-07"
as.Date(a,format="%Y-%m-%d")
?strftime
seq(as.Date("2020-01-01"),as.Date("2021-01-01"),by=1)
?ts
sales<-round(runif(48,min=50,max=100))
ts(sales,start=c(2010,5),end=c(2014,4),frequency=1)
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python数据分析是指使用Python编程语言进行处理、数据可视化和数据建模的过程。下面是Python数据分析入门步骤: 1. 安装Python和相关库:首先,你需要安装Python解释器。你可以从Python官方网站下载并安装最新版本的Python。在安装Python之后,你需要安装一些常用的数据分析库,如NumPy、Pandas和Matplotlib。你可以使用pip命令来安装这些库。 2. 学习Python基础知识:在开始进行数据分析之前,你需要掌握一些基本的Python编程知识,如变量、数据类型、条件语句、循环等。你可以通过阅读Python的官方文档或参考一些在线教程来学习Python基础知识。 3. 学习NumPy库:NumPy是Python中用于科学计算的一个重要库。它提供了多维数组对象和一些用于操作数组的函数。学习NumPy可以帮助你更高效地处理和操作大量的数据。你可以通过阅读NumPy的官方文档或参考一些在线教程来学习NumPy。 4. 学习Pandas库:Pandas是Python中用于数据分析的一个强大库。它提供了高效的数据结构和数据分析工具,如DataFrame和Series。学习Pandas可以帮助你更方便地进行数据清洗、数据处理和数据分析。你可以通过阅读Pandas的官方文档或参考一些在线教程来学习Pandas。 5. 学习Matplotlib库:Matplotlib是Python中用于数据可视化的一个常用库。它提供了各种绘图函数和工具,可以帮助你将数据可视化为图表、图形和图像。学习Matplotlib可以帮助你更好地理解和展示数据。你可以通过阅读Matplotlib的官方文档或参考一些在线教程来学习Matplotlib。 6. 实践项目:最后,你可以通过实践一些数据分析项目来巩固所学的知识。你可以从一些开放的数据集中选择一个感兴趣的主题,然后使用Python进行数据清洗、数据处理和数据可视化。这样可以帮助你更深入地理解和应用Python数据分析的技术。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值