问题描述
导入数据的时候,数据原本的格式是类似“888”的character字符串格式,希望转变成numeric数值型的格式方便计算,使用as.numeric() 时报错如下:
header$event = as.numeric(header$event)
强制改变过程中产生了NA
解决方法
报错的原因主要是因为原始数据中含有除了数字以外的字符,比如双引号(文本格式经常容易自带)或者逗号(科学计数法情况下容易自带),所以去掉这些符号即可,使用 gsub 函数
# 去除name列里面的引号
name_clean = gsub('["]', '', name)
# 去除name列里面的逗号
name_clean = gsub('[,]', '', name)
去掉这些特殊符号后再使用 as.numeric() 即可