R语言学习笔记(2)——str_detect()函数

本文介绍了R语言中str_detect()函数的使用,用于检测字符串是否匹配特定模式。通过示例展示了在处理文本数据时,如何利用该函数进行单词计数,并注意其区分大小写的特点。同时,提到了正则表达式的锚点概念,如^和$用于实现精确匹配。
摘要由CSDN通过智能技术生成

摘要

这次的问题是要弄清除一个单词在一片文章里出现的次数,用到了str_detect()函数。我把遇到的问题及解决方法分享一下,函数说明按照自己容易理解的方式表达,欢迎指正,谢谢。

函数说明

  • str_detect():确定一个字符向量能否匹配一种模式
  • str_detect(string,pattern,negate=FALSE)
  • string:待匹配字符串(我这里是文章)
  • pattern:待匹配的模式(需要去查找的字符串)
  • negate:默认为FALSE,如果为TRUE,则返回没有匹配到的元素
  • 返回值是逻辑值

实例

1.先导入一个txt文件,各位用自己的文件吧,导入文件需要用到readr包,使用str_detect()函数需要用tidyverse包。

library(readr)
library(tidyverse)
#  ***处为各位的文件路径
#   what='c' 是以字符形式读入文件
textA=scan('C:/******/text A.txt',what = 'c') 

文件读入后大概就是下面这个样子(textA的部分内容):

2.然后要找but,may,maybe,might,would,will出现的次数

a<-sum(str_detect(textA,'but'))
b<-sum(str_detect(textA,'may'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值