5.24通过实践学习r p20-p31,学习笔记:
head函数意思是提取数据的前面几列,可以是表头,也可以是前面几列
对于数据框来说可以用nrow函数和dim函数来查看数据框的行和列的值。nrow返回的是这组数据集每列的观测值,dim返回的是行列值
对于1个data.frame来说,可以用name(xx)来查看数据框的表头,或者称呼为变量名称。
str(xx)可以来反映维度以及每个变量的名称和类型。
数据框格式和矩阵格式是可以相互转化的,数据框格式转化为矩阵可以用as.matrix,而矩阵转化为数据框格式同理可以用as.data.frame
w=as.data.frame(arrests)
is.na()函数可以对缺失值返回true。
数据框的使用summary(xx):可以统计数据框的基本统计数据,包括最小值,三个四分位数,及最大值来概括数据分布的情况。
当我们想要从数据框中提取数据时,可以直接进行行列索引如:
USArrests["California",]
USArrests["California","Murder"]
我们也可以使用美元符号进行提取数据。
USArrests$Assault
链接数据框:
我们可以用attach()函数进行链接数据框,实例如下
> attach(USArrests)
> q <- Murder*100/(Murder+Assault+Rape)
> q
> with(USArrests,expr = {
+ murder.pct = 100 *Murder /(Murder+Assault +Rape)
+ })
> murde.pct
两种方法都可以链接数据框但是用with链接数据框格式这只能在内部使用如果想取消数据框链接可以使用detach()函数来取消链接。
在数据框绘图过程中,可以使用plot()函数进行绘图,也可以使用pairs()函数继续宁所有系列的对比绘图。
人生苦短,我学python,ovo