新手小白初看R语言实战,从新手的角度体验R(不是简单地复制粘贴书,有错望见谅)

第二单元 创建数据集

2.2数据结构

数据集

①定义:由数据构成的一个矩形数组,行表示观测,列表示变量

②示例:

正在上传…重新上传取消

数据结构

①定义:存储数据的对象类型

②种类:包括标量、向量、矩阵、数组、数据框和列表

向量

①定义:用于存储数值型、字符型或逻辑型数据的一维数组

正在上传…重新上传取消②函数:c()——创建向量——

③注:标量是只含有一个元素的向量

④方法:1、访问指定位置数据

           使用中括号,示例如下:正在上传…重新上传取消

           不能用a[1,2]

         

⑤特点:仅能包含一种数据类型

矩阵

正在上传…重新上传取消①定义:是一个二维数组

②函数:matrix()——创建矩阵

③方法:下标运用

正在上传…重新上传取消

正在上传…重新上传取消④特点:仅能包含一种数据类型

数组

①定义:与矩阵类似,但是维度可以大于2

②函数:array()——创建数组

正在上传…重新上传取消③特点:仅能包含一种数据类型

④方法:选取(中括号左至右:行、列、维度)

数据框

①定义:不同的列可以包含不同模式(数值型、字符型等)的数据

②函数:data.frame()——创建数据框

③注:每一列的名称可由函数names指定,每一列必须为同种类型数据

正在上传…重新上传取消

正在上传…重新上传取消

④方法:选取

       

正在上传…重新上传取消       创建列联表

⑤一些辅助函数:1、attach()

                   作用:数据框添加到R的搜索路径中,当R遇到一个变量,自动检索路径中的数据框

                   正在上传…重新上传取消

                   局限:函数attach()和detach()最好在你分析一个单独的数据框,并且不太可能有多个同名对象时使用

  1. dettach()

   作用:数据框从搜索路径中移除

  1. with()

      作用:使括号内代码根据指定数据框执行

正在上传…重新上传取消

局限:若在with中赋值,则赋值只在括号内生效

⑥示例标识符:①定义:区分数据集中不同的个体

              ②确定:data.frame()中的rowname选项指定

正在上传…重新上传取消  

因子:①定义:类别(名义型)变量和有序类别(有序型)变量在R中称为因子(factor)

      ②函数:factor()——以整数来存储类别——设定名义型变量和顺序型变量,并使针对此变量的分析全都按期设定的变量类型来

正在上传…重新上传取消              名义:

正在上传…重新上传取消

正在上传…重新上传取消 顺序:

调节因子内部数据排序:

levels选项来覆盖默认排序,越前面越小

正在上传…重新上传取消

数值:使用levels和labels,要注意一一对应

正在上传…重新上传取消

正在上传…重新上传取消列表:①定义:是一些对象(或成分,component)的有序集合,对象之间可以无关,可以是不同种类的数据结构

      ②函数:list()——创建列表

      ③方法:访问(用序号和名字选项)

正在上传…重新上传取消

2.3数据的输入

①键盘输入

①文本编辑器——edit()

  1. 创建一个空数据框(或矩阵),其中变量名和变量的模式需与理想中的最终数据集一致
  2.  针对这个数据对象调用文本编辑器,输入你的数据,并将结果保存回此数据对象中。

          mydata <- data.frame(age=numeric(0),gender=character(0), weight=numeric(0))

          mydata <- edit(mydata)  #  fix(mydata)和edit(mydata)一样

②直接嵌入数据集

        mydatatxt <- "

        age gender weight

        25 m 166

        30 f 115

        18 f 120

        "

        mydata <- read.table(header=TRUE, text=mydatatxt)

        

②文本文件导入

①read.table()函数导入

  1. 作用:从带分隔符的文本文件中导入数据,可读入一个表格格式的文       件并将其保存为一个数据框
  2. 语法:read.table(file, options),file为文本文件,options为选项

正在上传…重新上传取消

③导入Excel文件

①将Excel文件保存为csv文件再用read.table()导入

②用xlsx包导入

    作用:可以用来对Excel 97/2000/XP/2003/2007文件进行读取、写入和格式转换

        函数:read.xlsx()——导入一个工作表到一个数据框中

正在上传…重新上传取消

④导入SPSS数据

①foreign包中的read.spss()导入到R

②Hmisc包中的spss.get()导入到R(更好)

正在上传…重新上传取消

2.4数据集的标注

①为变量名添加描述性的标签(变量标签)

  1. 直接把变量标签设为变量名

  使用names()

正在上传…重新上传取消

   然后访问用patientdata[2]下标访问

  1. 值标签

  使用factor()——为类别型变量创建值标签

正在上传…重新上传取消

2.5一些实用函数

正在上传…重新上传取消

正在上传…重新上传取消

小补充:str()——提供R中某个对象的信息

        Summary()——显示对象的统计概要。连续型变量——最小值、最大值、均值和各四分位数,类别型变量——频数值。

        R中的下标不从0开始,而从1开始

        R中没有标量。标量以单元素向量的形式出现

美元符号($)指定一个数据框或列表中的某些部分。例如,A$x是指数据框A中的变量x

将一个值赋给某个向量、矩阵、数组或列表中一个不存在的元素时,R将自动扩展这个数据结构以容纳新值

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值