0.美图
自然语言处理部分,首先就是要分词了,学习一下!
1. jiebaR对字符串进行分析
使用jiebaR的第一步当然是安装jiabaR包并加载咯
安装: install.packages("jiebaR")
加载: library(jiebaR)
三种分词语句的写法:
wk = worker()
#方法1
wk["我希望未来会很好"]
#方法2
wk<="我希望未来会很好" #此处用=的话可不行哟
#方法3
segment("我希望未来会很好",wk)
结果都是一样的,如下
[1] "我" "希望" "未来" "会" "很" "好"
2. jiebaR对txt文件进行分析
当然也可对文本文件进行分词:当前目录下