library(rJava)之后,可以用Rwordseg包分词,Rwordseg支持自己导入词典,删除词典
> installDict(dictpath='E:\\HAO\\大数据分析\\词库\\搜狗词库\\计算机词汇大全【官方推荐】.scel',dictname="计算机",dicttype="scel")
> installDict(dictpath='E:\\HAO\\大数据分析\\词库\\搜狗词库\\计算机词汇大全【官方推荐】.txt',dictname="计算机",dicttype="text")
两种格式,scel是从搜狗词库下载的
text格式的可以文本是每行一个词,可以自己导入
删除
> uninstallDict(removedict='计算机')