中文导入R 解决乱码和格式问题

本文记录了在R中导入含有中文的csv文件时遇到的无法导入、格式错乱和乱码问题及其解决方案。首先,通过设置`header=False`解决列数不匹配问题。其次,为了解决数据不整齐,可以将csv转换为Excel格式再导入。对于乱码,尝试修改R的编码设置或通过SPSS保存为sav格式,再导入R。总结来说,当遇到导入问题时,可以尝试转换为其他文件格式后再导入。
摘要由CSDN通过智能技术生成

在将从网页上爬取下来的中文,导入R中产生一系列问题,包括格式问题和乱码问题,在网上找了好多方法,转换了各种编码格式,不管用==解现在总算解决了,又怕自己以后忘掉,就想把它记下,以后再碰到的时候就不会有问题了。

在含有中文文本的csv文件导入R中有可能碰到三个问题:

1. 无法导入

在这里插入图片描述2. 格式问题,一列数据导入后变成多列:
源数据如下所示:
在这里插入图片描述导入后,数据变成多列数据,

在这里插入图片描述3. 乱码问题, 如上图所示,中文均为乱码。
将编码转成utf8,gbk,均无法解决乱码问题

解决方法

第一个问题是数据无法导入的问题,错误是“列的数目要比列的名字要多”,也就意味着数据中一列导入后产生了多列。本来有n列,但是导入以后产生了n+1列,那么列名就不够用了。
要想导入不报错,可以把列名去掉,添加参数hea

  • 3
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值