前期检查 注意区别
注意:需要区分 test.r 文件和 test.rmd 文件。在新建的test.r 文件中写程序。
注意:测试程序是否能够运行。
注意:需要检查csv文件是否正常能够打开。
有“world.scv”和“data.csv”两份文件,同样是csv格式的文件,但是前者能用r语言打开,后者不能(后者的数据从国家统计局处下载)。为什么会出现这种情况?发现使用WPS将csv文件改动后,运行程序会出现这样的错误类型:
Error in make.names(col.names, unique = TRUE) :
invalid multibyte string at '<b5><d8><c7><f8>'
但是,如果用Microsoft Excel操作csv表格后,就不会出现这样的错误类型。
对于文件要处理,避免被它的名字和外貌欺骗。
getwd()
setwd("E:/DH")
data=read.table("world.csv",header=T,sep=",")
data
header(data)
同样地,用如下代码,也能够用R程序打开符合格式的csv文件。
getwd()
setwd("E:/DH")
rc=read.csv("world.csv")
R语言attach( )函数,将csv文件中的横向第一行作为变量名。
getwd()
setwd("E:/DH")
rc=read.csv("world.csv")
attach(rc)
运行程序,出现下列结果:
The following objects are masked from rc (pos = 3):
CO2.排放量, GDP, 办税小时数, 城市人口, 出境旅游,
出生率, 出生率数据桶, 贷款利率, 地区, 高于阈值.,
国家.地区, 互联网使用率, 记录数, 经商便利度,
经商便利度.群集., 开业天数, 男性预期寿命, 能源使用,
年份, 女性预期寿命, 人均.GDP, 人均医疗费用,
人口.0.14, 人口.15.64, 人口.65., 人口总数, 入境旅游,
手机使用率, 新生儿死亡率, 医疗费用...GDP, 营业税税率,
预期寿命
选择其中一个变量,就会得到相应的数据。
getwd()
setwd("E:/DH")
rc=read.csv("world.csv")
attach(rc)
经商便利度
CO2