目录
一、语句的分割
在使用R语言时,常常需要将一段句子拆成单词,此时可以使用strsplit()函数。
二、修改字符串的大小写
toupper():这个函数可以将字符串改成大写。
tolower():这个函数可以将字符串改成小写。
三、unique()函数的使用
这个函数主要是让向量内容没有重复地出现。unique()函数可以让所有元素内容不重复出现。
四、字符串的连接
4.1 使用paste()函数常见的失败案例1
上述实例使用paste()函数失败,最主要的原因是paste()函数内有c()函数,字符串经过c()函数处理后就会形成一个字符串向量。
4.2 使用paste()函数常见的失败案例2
与上一个案例失败的原因相同。
4.3 字符串的成功连接与collapse参数
若是想用paste()函数成功将字符串向量内的字符串连接,需加上collapse参数。假设字符串是使用空格连接,则在paste()函数加上collapse=""参数即可。
将collapse参数设为NULL,与不加上此参数的结果相同。其实collapse参数除了NULL外,可以是任何其他字符,这个字符将是连接各个单字符的字符。
4.4 再谈paste()函数
其实paste()函数的主要目的是将两个或多个向量连接。
在连接的向量中,每个元素间以空格分开,如果我们不想让元素间有空格,可以在paste()函数内加上seq=" "参数。
如果要连接的两个向量的长度(元素个数)不相同,R语言会使用重复机制,让较短的向量重复,直至与较长向量的长度相等。
4.5 扑克牌向量有趣的应用
五、字符串数据的顺序
sort()函数会为字符串向量的元素排序,默认是从小排到大,至于元素本身则不做排序。另外,decreasing参数默认是FALSE,如果设为TRUE,则排序是按由大排到小。
六、查找字符串的内容
6.1 使用索引值搜索
如果我们知道所要查找的字符串的索引值,那么可以使用substr()函数查找字符串。
6.2 使用grep()函数搜索
grep()函数是一个查找功能非常强大的函数。如果你去图书馆想找一本书,只知道Word 2013的书,却不知道完整书名,那么只输入“Word 2013”,系统即可搜索。这个函数的基本使用格式如下所示:
grep(pattern,x)
pattern:代表搜索的目标内容。
x:是字符串向量。
如果在搜索时,找不到所搜索的内容,R语言将响应“character(0)”,表示是空的向量。
七、字符串内容的更改
sub()函数可以对搜索的字符串内容执行更改,这个函数的使用格式如下:
sub(pattern,replacement,x)
pattern:要搜索的字符串。
replacement:将要取代原字符串的字符串。
x:字符串向量。
八、正则表达式
8.1 搜索具有可选择性
搜索具有可选择性,相当于具有or的特性,它的R语言语法是使用"|"符号,这个符号与"\"在同一个键盘按键上。
8.2 搜索分类字符串
可以使用"( )"符号搭配"|"符号,将所搜索的字符串分类。
8.3 搜索部分字符可重复的字符串
在搜索中可以添加"*"代表出现0次或多次,添加"+"代表出现1次或多次。