R语言学习笔记（2)——str_detect()函数

最新推荐文章于 2024-04-30 09:00:27 发布

句号的弟弟

最新推荐文章于 2024-04-30 09:00:27 发布

阅读量1.7w

点赞数 11

文章标签： r语言正则表达式字符串

本文链接：https://blog.csdn.net/weixin_42437924/article/details/108700663

版权

本文介绍了R语言中str_detect()函数的使用，用于检测字符串是否匹配特定模式。通过示例展示了在处理文本数据时，如何利用该函数进行单词计数，并注意其区分大小写的特点。同时，提到了正则表达式的锚点概念，如^和$用于实现精确匹配。

摘要由CSDN通过智能技术生成

摘要

这次的问题是要弄清除一个单词在一片文章里出现的次数，用到了str_detect()函数。我把遇到的问题及解决方法分享一下，函数说明按照自己容易理解的方式表达，欢迎指正，谢谢。

1.先导入一个txt文件，各位用自己的文件吧，导入文件需要用到readr包，使用str_detect()函数需要用tidyverse包。

library(readr)
library(tidyverse)
#  ***处为各位的文件路径
#   what='c' 是以字符形式读入文件
textA=scan('C:/******/text A.txt',what = 'c')

文件读入后大概就是下面这个样子（textA的部分内容）：

2.然后要找but,may,maybe,might,would,will出现的次数

a<-sum(str_detect(textA,'but'))
b<-sum(str_detect(textA,'may'

关注