熟悉microsoft Excel的小伙伴们可能经常用到VlookUP函数进行字符串的查询。其实在R语言中也有对应的软件包方便研究者查询、提取数据库中的字符串信息。在本节中,笔者将分享stringr包中几个常见函数在的电子病历(EDC)场景的应用。
首先是str_sub函数,用于提取某一变量中指定位置的字符串(即字符串取子集),其简单用法如下:
#例如,我们生成一个字符串
world<-"I subscribed to the R_notebook"
library(stringr)
str_sub(world,1,12)
#[1] "I subscribed"
str_sub(world,16