R语言 第3章 R语言常用的数据管理(2)

本文介绍了R语言中正则表达式的用途和常见函数,如grep、grepl、sub、gsub等,展示了如何进行字符串查找、替换和处理。还提及了R中的文本分词工具RWordseg和jiebaR包,以及数据处理函数如apply家族和数据整合方法。
摘要由CSDN通过智能技术生成

关注公众号凡花花的小窝,收获更多的考研计算机专业编程相关的资料
字符串处理
正则表达其实就是对文本进行模式匹配,所有语言中的正则表达式都有一些共同的特征。我们使用help(regex)命令查看R正则表达的帮助内容。
在我看来,正则表达式的主要用途有两种:
①查找特定的信息
②查找并编辑特定的信息,也就是我们经常用的替换。比如我们要在Word,记事本等里面使用快捷键Ctrl+F,进行查找一个特定的字符,或者替换一个字符,这就使用了正则表达式。
正则表达式的功能非常强大,尤其是在文本数据进行处理中显得更加突出。R中的grep、grepl、sub、gsub、regexpr、gregexpr等函数都使用正则表达式的规则进行匹配。
正则表达式简介
正则表达式是用于描述或匹配一个文本集合的表达式。所有英文字母、数字和很多可显示的字符本身就是正则表达式,用于匹配它们自己。
一些特殊的字符在正则表达式中不在用来描述它自身,它们在正则表达式中已经被“转义”,这些字符称为“元字符”。常用元字符:
在这里插入图片描述
字符串处理函数
字符处理函数可以从文本型数据中抽取信息,或者为打印输出和生成报告重设文本的格式。常用的字符串处理函数:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

学习记录wanxiaowan

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值