在R语言中使用Rwordseg包的segmentCN函数在分词时,如果出现下面这个错误:
Error in .jcall(analyzer, "S", strfunc, X) :
java.lang.NullPointerException
解决方法:
text<-enc2utf8(text) #转utf-8,有些格式它不支持
text<-text[Encoding(text)!='unknown']#清除无法识别的字符
word.message<-segmentCN(text)#分词
OK,这样的话既可以了。