R语言正则表达式语法共享(更新中)

R语言正则表达式语法

在之前文章stringr包里面提到需要用到正则表达式的去处理一些杂乱数据,尤其是在处理从网络爬取的数据,而非自由平台的数据时候,数据是非常脏的。

R语言可运用正则表达式的函数

   1、有基础包自带函数grep, grepl, regexpr, gregexpr,regexec,sub,gsub 这些函数的参数都一样

grep(pattern, x, ignore.case = FALSE, perl = FALSE, value = FALSE, useBytes = FALSE, invert = FALSE)

常用参数说明

pattern:正则表达式或者固定字符串

x:需要处理的数据向量/文本

ignore.case:是否区分大小写

perl:是否用perl兼容的参数

invert:是否返回不匹配的值

2、stringr包中的匹配、提取函数(如:str_replace、str_replace_all、str_detect、str_match、str_extract)同样可以根据正则表达式语法构造所需要的通配符。

正则表达式基本语法:

在R正则表达式里预定义的字符类选集

[:digit:] 数字:0-9 [:punct:] 标点符号
[:lower:] 小写字母:a-z [:graph:] 图形字符:[:alnum:]、[:punct:]
[:upper:] 大写字母:A-Z [:blank:] 空格字符:空格和制表<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

LEEBELOVED

一分钱都是爱

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值