技术日记_备查:R中的缺失值替换

本文档记录了在R中进行collostruction analysis时遇到的缺失值替换问题。由于数据从Excel读入后变为factor类型,导致无法直接替换缺失值(NA)。解决方案是先将factor列转换为字符或数字类型,然后进行缺失值替换。建议通过保存为.csv文件或在创建dataframe时设定参数避免此类问题。
摘要由CSDN通过智能技术生成
关键字:R; 缺失值替换; collostruction analysis; linguistics

背景:
开题pilot study想用 collostruction analysis(或distinctive collexeme analysis,DCA,本质为Fisher exact test)看看to-infinitival complement在两种英语变体(American English和Singapore English)和哪些matrix verbs联系紧密,遂用ICE-USA和ICE-Singapore作为原始语料,以#lancbox为工具检索抽取所需语料,并使用R做统计分析。

问题描述:
提取所需数据后,将数据放在excel中做调整,并保存为xlsx,用R中的openxlsx读出数据,cbind()其中两列到新变量a,此时这两列数据就变成了factor类型。如法炮制变量bmerge()到变量c,想用c[is.na(c)] <- 0替换掉空缺值时报错如下:

Warning message:
In `[<-.factor`(`*tmp*`, thisvar, value = 0) :
  invalid factor level, NA generated

原因及解释:
从网上查找后初步得出原因,是由于在

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值