关闭

Rwordseg包如何加载本地词典

2038人阅读 评论(0) 收藏 举报
分类:

    尽管Rwordseg对中文分词已经做得很好了,但有的时候还是不行的。我们可以加载本地词典。比如我们从搜狗官网上面下载下来的.scel词典,可以通过下面方法加载:

installDict("D:\\Program Files\\R\\R-3.3.1\\library\\Rwordseg\\dict\\计算机名词.scel","sougou")

如果要删除这个词典的话需要使用 uninstallDict()函数。

uninstallDict("D:\\Program Files\\R\\R-3.3.1\\library\\Rwordseg\\dict\\计算机名词.scel","sougou")

查看加载了多少个词典可以使用listDict()函数,它不需要参数。


这里加载了计算机名词的一个词库,我们命名它为搜狗。

4
0
查看评论
发表评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场

[R语言]快速安装用户自定义词典——用于分词

介绍下我使用的分词包:Rwordseg。摸索了下如何安装词典,相信不少人有这个需求。我整理下,非常的简单。当然这只针对我个人而言,新手一枚,可能有某位大神有更好的方法。1、词典准备直接新建一个txt的...
  • htx931005
  • htx931005
  • 2015-09-29 11:05
  • 2447

Rwordseg安装词典

library(rJava)之后,可以用Rwordseg包分词,Rwordseg支持自己导入词典,删除词典 > installDict(dictpath='E:\\HAO\\大数据分析\\词库\\...
  • whzhcahzxh
  • whzhcahzxh
  • 2013-11-06 18:10
  • 2393

R语言︱文本挖掘之中文分词包——Rwordseg包(原理、功能、详解)

笔者寄语:与前面的RsowballC分词不同的地方在于这是一个中文的分词包,简单易懂,分词是一个非常重要的步骤,可以通过一些字典,进行特定分词。大致分析步骤如下: 数据导入——选择分词字典——分词...
  • sinat_26917383
  • sinat_26917383
  • 2016-04-04 13:38
  • 17663

R语言中的Rwordseg包详细使用教材

中文分词一直是一个不大容易解决的问题,Rwordseg包是一个很不错的包,之前的tm包效果实际不是很理想,当然还出现了一个jiebaR的包,这个跟python中的jieba有点像,不说了,具体上代码看...
  • luoyexuge
  • luoyexuge
  • 2015-10-16 11:02
  • 5206

R语言文本挖掘1——词云制作,基于Rwordseg包

基于Rwordseg包的词云分析
  • wangzfox
  • wangzfox
  • 2015-05-18 00:20
  • 1802

无法加载rJava包、Rwordseg包的解决方法

无法加载rJava包、Rwordseg包的解决方法 可能是目前为止比较全的教程 可能是目前为止比较搞笑的教程 可能是目前为止遭遇比较奇特的教程 可能是目前为止博主比较傻的教程
  • qq_34773726
  • qq_34773726
  • 2017-04-10 23:02
  • 716

ansj词典加载及简洁分词过程

ansj词典加载及简要分词过程 粗略看了点ansj源代码,记录备忘。   词典等配置文件加载类 (以调用 NlpAnalysis 分词类为例): 1,   MyStaticValue 初始化 NlpA...
  • qq_26562641
  • qq_26562641
  • 2015-12-17 15:10
  • 7332

疑难杂症-R中的Rwordseg包安装

一、通过install.packages安装 步骤: 1、在R中先装rJava包 install.packages(“rJava”) 2、没有装JDK的要到这里去下载: http://www...
  • lll1528238733
  • lll1528238733
  • 2017-07-18 01:13
  • 167

R语言-Rwordseg中文分词包安装步骤

1.在R中先装rJava包 2.没有装JDK的要到这里去下载http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads...
  • qq_34941023
  • qq_34941023
  • 2016-05-14 15:03
  • 5118

文本分析常用R包的安装(Rweibo、wordcloud、tm、tmcn、Rwordseg、Rcharts、xlsx、XLConnect)

为了使用文本分析挖掘,必须要先安装一些R包,比如Rwordseg包常用于分词、tmcn用于词频统计、wordcloud用于绘制文字云。在R中,有些包是需要额外设置安装的,且设置起挺麻烦的,因此,以下总...
  • juliefish
  • juliefish
  • 2016-05-25 02:57
  • 5528
    个人资料
    • 访问:397097次
    • 积分:3880
    • 等级:
    • 排名:第9484名
    • 原创:90篇
    • 转载:1篇
    • 译文:3篇
    • 评论:46条
      我的微信公众号
      欢迎关注我的公众号,《跟着菜鸟一起学R语言》不仅为你推荐最新关于R语言的博文,还有更多惊喜和资源在等着你!
    博客专栏
    最新评论