Part1 安装依赖包
(关于32位和64位的问题在原文基础上做了些改动)
R语言中中文分析的软件包是Rwordseg,Rwordseg软件包依赖rJava包,rJava需要本机中有安装Java。
第一步:安装Java,请安装JDK,JRE不行。请对应机型,下载安装JDK。
下载地址:
http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
查看JAVA是否安装成功,运行cmd,输入java –version,如果能正常显示你的Java版本则安装正确。如下图:
第二步:安装R
R的下载地址:http://cran.rstudio.com/
RStudio的下载地址:http://www.rstudio.com/products/rstudio/#Desk
重点:一般在安装R的时候可以选择32位或者64位的,尽量都安装
第三步:安装rJava,这个直接在R或者RStudio里面安装软件包就行了。如果是刚安装完java记得重启你的R或者RStudio。
直接输入命令安装:Install.packages(“rJava”);或下载R包,手动tools>install packages安装。
加载rJava包,library(“rJava”),没提示错误则rJava安装成功。
第三步是安装Rwordseg。
RStudio,请设置为32位,设置方法,工具栏Tools > Global Options > General,R version,改成32-bit。
Rwordseg项目目前发布在R-forge上,所以不能直接在R或者Rstudio中用安装软件包功能。
Rwordseg包下载地址:http://R-Forge.R-project.org/bin/windows/contrib/3.0/Rwordseg_0.2-1.zip
后来尝试把软件包下载到本地后,从本地安装,tools>install packages,选择从本地zip文件安装软件包。
或者以下方法安装:
在最新版本的R下可以直接安装:
如果是旧版本的R,可以通过source的方式进行安装:
RStudio设置成64位,重启RStudio
尝试使用Rwordseg,如下一个简单的例子:
另外,该R包的中文文档下载地址: http://download.csdn.net/detail/cl1143015961/8436741
该文档中很详细地说明了软件包的功能,包括如何做分词,如何添加删除词语,如何添加删除字典,它支持的字典除了.dic格式之外,还有.scel(搜狗输入法的词库)。搜狗输入法的词库下载地址http://pinyin.sogou.com/dict/,选择你自己需要的分类去做尝试吧!