本文章主要介绍了三种方式,分别是“键盘输入”,“从文本文件导入”,“导入Excel数据”。
键盘输入
- 1.先定义一个数据框,只定义该数据框的各对象属性及名字,先不指定值:
> mydata <- data.frame(age=numeric(0),
+ gender=character(0),
+ weight=numeric(0))
- 2.使用键盘对该数据框进行输入数据:
> mydata <- edit(mydata)
注意: (1)edit()
方式一定要对编辑结果进行返回给mydata
数据框,才能保存编辑结果。
(2)另一种方式(fix()
)不需要对编辑结果进行返回给mydata
数据框。直接执行> fix(mydata)
该指令即可启动数据编辑器窗口进行编辑,并且数据会自动保存给mydata
数据框。所以相对来说fix()
方式比edit()
方式更加简洁
- 3.回车后会弹出一个表格框,进行键盘输入即可,而且还能添加新列,效果如下图:
- 4输入完数据后,将该数据编辑器窗口关闭,再来查看:
> mydata
age gender weight isteacher
1 25 m 120 y
2 30 f 140 n
3 18 f 98 n
从文本文件导入
例:
- 1、准备一个txt文件,以英文逗号(
,
)作为分隔符,如下:
accident.txt
文件,所在位置是’D:\workspaces_R\Documents\accident.txt’
id,SGBH,DMSM1,SGDD,SGFSSJ
1,3101176201400124,伤亡事故,泗陈公里出余北公路东约2米,2014-8-29 18:30:00
2,3101176202401125,伤亡事故,泗陈公里出余北公路东约3米,2015-9-29 19:30:00
3,3101176203402126,伤亡事故,泗陈公里出余北公路东约4米,2016-10-29 20:30:00
4,3101176204403127,伤亡事故,泗陈公里出余北公路东约5米,2017-11-29 21:30:00
5,3101176205404128,伤亡事故,泗陈公里出余北公路东约6米,2018-12-29 22:30:00
6,3101176206405129,伤亡事故,泗陈公里出余北公路东约7米,2019-1-29 23:30:00
7,3101176207406130,伤亡事故,泗陈公里出余北公路东约8米,2020-2-29 00:30:00
-
2、读取txt文件内容
- 格式:
read.table("path", header=TRUE, sep="分隔符")
参数1
是指定文件所在路径,参数2
为TRUE时是先把文件第一行读取出来,在本文件里第一行是各列的属性值,故需设为TRUE,参数3
是指定文件中个值之间的分隔符,本文件是以英文逗号(,
)分隔开的,故设sep=","
- 格式:
> data <- read.table("D:/workspaces_R/Documents/accident.txt", header=TRUE, sep=",")
> data
id SGBH DMSM1 SGDD SGFSSJ
1 1 3.101176e+15 伤亡事故 泗陈公里出余北公路东约2米 2014-8-29 18:30:00
2 2 3.101176e+15 伤亡事故 泗陈公里出余北公路东约3米 2015-9-29 19:30:00
3 3 3.101176e+15 伤亡事故 泗陈公里出余北公路东约4米 2016-10-29 20:30:00
4 4 3.101176e+15 伤亡事故 泗陈公里出余北公路东约5米 2017-11-29 21:30:00
5 5 3.101176e+15 伤亡事故 泗陈公里出余北公路东约6米 2018-12-29 22:30:00
6 6 3.101176e+15 伤亡事故 泗陈公里出余北公路东约7米 2019-1-29 23:30:00
7 7 3.101176e+15 伤亡事故 泗陈公里出余北公路东约8米 2020-2-29 00:30:00
> head(data)
id SGBH DMSM1 SGDD SGFSSJ
1 1 3.101176e+15 伤亡事故 泗陈公里出余北公路东约2米 2014-8-29 18:30:00
2 2 3.101176e+15 伤亡事故 泗陈公里出余北公路东约3米 2015-9-29 19:30:00
3 3 3.101176e+15 伤亡事故 泗陈公里出余北公路东约4米 2016-10-29 20:30:00
4 4 3.101176e+15 伤亡事故 泗陈公里出余北公路东约5米 2017-11-29 21:30:00
5 5 3.101176e+15 伤亡事故 泗陈公里出余北公路东约6米 2018-12-29 22:30:00
6 6 3.101176e+15 伤亡事故 泗陈公里出余北公路东约7米 2019-1-29 23:30:00
注: 1、head(data)
是只读取数据框data
的前六行。
2、如果读取报错,可能是该txt文件格式编码不对,要将他改为ASCII编码(ANSI)格式。
导入Excel数据
- 1、准备一个的Excel文件,将其另存为
.csv
格式的文件,内容如下:
- 2、导入该
.csv
格式Excel文件 - 格式:
read.csv("path", header=TRUE, sep="分隔符")
> data1 <- read.csv("D:/workspaces_R/Documents/bus.csv", header=TRUE, sep=",")
> data1
公交车编号 线路编码 站点编码 协议编码 进出站状态 方向 车截上报时间
1 059L0809 10065 938A0000 42 进站 下行 2015/4/1 4:45
2 059L0809 10065 938A0000 42 出站 下行 2015/4/1 4:45
3 059L0809 10065 938A0006 42 进站 下行 2015/4/1 4:50