R文本挖掘之一安装R软件和包

原文地址:CSDN-R语言做文本挖掘 Part1安装依赖包


Part1 安装依赖包

关于32位和64位的问题在原文基础上做了些改动

R语言中中文分析的软件包是Rwordseg,Rwordseg软件包依赖rJava包,rJava需要本机中有安装Java 

第一步:安装Java,请安装JDK,JRE不行。请对应机型,下载安装JDK。

下载地址:

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

查看JAVA是否安装成功,运行cmd,输入java –version,如果能正常显示你的Java版本则安装正确。如下图:


第二步:安装R 

R的下载地址:http://cran.rstudio.com/

RStudio的下载地址:http://www.rstudio.com/products/rstudio/#Desk

重点:一般在安装R的时候可以选择32位或者64位的,尽量都安装


第三步:安装rJava,这个直接在R或者RStudio里面安装软件包就行了。如果是刚安装完java记得重启你的R或者RStudio。

直接输入命令安装:Install.packages(“rJava”);或下载R包,手动tools>install packages安装。

加载rJava包,library(“rJava”),没提示错误则rJava安装成功。

 

第三步是安装Rwordseg。

RStudio,请设置为32位,设置方法,工具栏Tools > Global Options > General,R version,改成32-bit。


Rwordseg项目目前发布在R-forge上,所以不能直接在R或者Rstudio中用安装软件包功能。

Rwordseg包下载地址:http://R-Forge.R-project.org/bin/windows/contrib/3.0/Rwordseg_0.2-1.zip

后来尝试把软件包下载到本地后,从本地安装,tools>install packages,选择从本地zip文件安装软件包

或者以下方法安装:

在最新版本的R下可以直接安装:

[plain]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. install.packages("Rwordseg", repos = "http://R-Forge.R-project.org")  

如果是旧版本的R,可以通过source的方式进行安装:

[plain]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. install.packages("Rwordseg", repos = "http://R-Forge.R-project.org", type = "source")  
RStudio设置成64位,重启RStudio

尝试使用Rwordseg,如下一个简单的例子:

[plain]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. library(Rwordseg)  
  2. segmentCN(c("生命在于运动", "生活处处皆风景"))  
  3. [[1]]  
  4. [1] "生命" "在于" "运动"  
  5. [[2]]  
  6. [1] "生活" "处处" "皆"   "风景"  
另外,该R包的中文文档下载地址: http://download.csdn.net/detail/cl1143015961/8436741

该文档中很详细地说明了软件包的功能,包括如何做分词,如何添加删除词语,如何添加删除字典,它支持的字典除了.dic格式之外,还有.scel(搜狗输入法的词库)。搜狗输入法的词库下载地址http://pinyin.sogou.com/dict/,选择你自己需要的分类去做尝试吧!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值