数据清洗:提取字符串中的数字

数据清洗:提取字符串中的数字

在我们日常进行数据清洗的过程中,可能会遇到需要对字符串进行操作和处理的任务。在下面的例子中,我们收到了一份关于医院患者输注血制品的医嘱单,但遗憾的是,在这份数据集中,输注血制品的量包含在了一个字符串中而不是被正确的提取在用量这一列中。数据集如下:

> head(examdata)
    ID          ORDER_NAME DRUG_QUAN ZXDW
1 2559 输红细胞悬液2个单位         1 <NA>
2 1945 输红细胞悬液2个单位         1 <NA>
3 1846 输红细胞悬液2个单位         1 <NA>
4 2478       输血浆(400ml)         1 <NA>
5 2205 输红细胞悬液2个单位         1 <NA>
6 1571    输血小板10个单位         1 <NA>

stringr包与正则表达式

本次数据处理中,我们将利用stringr包来提取ORDER_NAME中的数字,并将其作为单独的一列,以方便我们后续进行数据的分析。stringr包是R语言中一个简单、易用的字符串操作工具,并且在这个包中,我们可以使用*正则表达式(Regular expressions)*进行字符串的匹配。关于stringr包与正则表达式的相关知识可以参考以下的学习资料:

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值