R语言学习

文章讨论了在R语言中读取CSV文件时遇到的问题,特别是当文件由WPS处理后导致的错误。‘world.csv’可以成功打开,而‘data.csv’由于编码问题无法正常读取。使用MicrosoftExcel处理文件则不会出现相同错误。此外,文章还介绍了如何使用attach()函数将CSV文件的第一行作为变量名进行数据操作。
摘要由CSDN通过智能技术生成

前期检查 注意区别

注意:需要区分 test.r 文件和 test.rmd 文件。在新建的test.r 文件中写程序。

注意:测试程序是否能够运行。

注意:需要检查csv文件是否正常能够打开。

有“world.scv”和“data.csv”两份文件,同样是csv格式的文件,但是前者能用r语言打开,后者不能(后者的数据从国家统计局处下载)。为什么会出现这种情况?发现使用WPS将csv文件改动后,运行程序会出现这样的错误类型:

Error in make.names(col.names, unique = TRUE) : 
  invalid multibyte string at '<b5><d8><c7><f8>'
但是,如果用Microsoft Excel操作csv表格后,就不会出现这样的错误类型。

对于文件要处理,避免被它的名字和外貌欺骗。

getwd()
setwd("E:/DH")
data=read.table("world.csv",header=T,sep=",")
data
header(data)

同样地,用如下代码,也能够用R程序打开符合格式的csv文件。

getwd()
setwd("E:/DH")
rc=read.csv("world.csv")

R语言attach( )函数,将csv文件中的横向第一行作为变量名。

getwd()
setwd("E:/DH")
rc=read.csv("world.csv")
attach(rc)

运行程序,出现下列结果:

The following objects are masked from rc (pos = 3):

    CO2.排放量, GDP, 办税小时数, 城市人口, 出境旅游,
    出生率, 出生率数据桶, 贷款利率, 地区, 高于阈值.,
    国家.地区, 互联网使用率, 记录数, 经商便利度,
    经商便利度.群集., 开业天数, 男性预期寿命, 能源使用,
    年份, 女性预期寿命, 人均.GDP, 人均医疗费用,
    人口.0.14, 人口.15.64, 人口.65., 人口总数, 入境旅游,
    手机使用率, 新生儿死亡率, 医疗费用...GDP, 营业税税率,
    预期寿命

选择其中一个变量,就会得到相应的数据。

getwd()
setwd("E:/DH")
rc=read.csv("world.csv")
attach(rc)
经商便利度
CO2

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值