常用数据探查函数

Task01–data structure@TOC

glimps()

library(dplyr)
library(readr)
h1n1_flu<-read_csv('/Users/shixinjin/Desktop/h1n1_flu.csv')
glimpse(h1n1_flu)

最终得到的结果为
在这里插入图片描述
从这里就可以看出,glimpse()起到了一个print()的转置功能,有时候,如果列数太多,用print()打印出来看不出来数据的全部列,这时候为了能看到所有列数,就可以使用glimpse()

str()

str(h1n1_flu)

最后得到的结果为
在这里插入图片描述
从这个结果我们可以看到每一列的名称,每一列的数据类型,以及总长度。看出来这是一个dataframe,共有26707行,33列。
他能够紧密的展示R的内在结构,是summary的替代品。对于任何类型的R数据结构都能用它来查看结构。

head()

head(h1n1_flu)

最终得到的结果为:
在这里插入图片描述
这个函数可以显示dataframe的前几行,可以设置参数n,来明确需要显示到底是前面几行。

tail()

tail(h1n1_flu)

最后得到的结果为
在这里插入图片描述
从这里就可以看出tail()这个函数显示的dataframe的后几行,和head()的用法相同。

View()

View(h1n1_flu)

得到的结果为
在这里插入图片描述
使用这个函数之后,它会自动跳转到看原始数据的界面中去.它能够唤起数据表格式的数据。

summary()

summary(h1n1_flu)

得到的结果为
在这里插入图片描述
从这个结果可以看出,它能够显示每一列中的最大值,最小值一分位数,三分位数和平均值。以及含有NA的个数。如果是字符型的列的话,会显示总长度,类型和模式。例如
在这里插入图片描述

nrow()

nrow(h1n1_flu)

得到的结果为
在这里插入图片描述
从这里可以看出,它能够显示一个dataframe的总行数。本来认为会有ncolumn,但实际情况下却发现并没有。总列数是用length()这个函数得到的

length()

length(h1n1_flu)

最后得到的结果为
在这里插入图片描述
length()可以显示dataframe的总列数。

class()

class(h1n1_flu)

最后得到的结果为
在这里插入图片描述
这个函数应该是可以显示数据类型。

table()

table(h1n1_flu$sex)

得到的结果为
在这里插入图片描述
如果某一列是因子的话,它可以统计不同水平的因子的个数。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值