![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
R语言
txHe
这个作者很懒,什么都没留下…
展开
-
[R语言]快速安装用户自定义词典——用于分词
介绍下我使用的分词包:Rwordseg。摸索了下如何安装词典,相信不少人有这个需求。我整理下,非常的简单。当然这只针对我个人而言,新手一枚,可能有某位大神有更好的方法。1、词典准备直接新建一个txt的文件,将词典写入这个文档,格式最好如下: 我因为个人需要保存为dep.txt。路径任意,为了方便,我是放在我的工作目录下的(所以等会安装路径不需要写上d:\path之类的)。2、开始安装–加载Rw原创 2015-09-29 11:05:58 · 8359 阅读 · 3 评论 -
[R语言]基本操作整理
1.变量变换 as.array(x),as.data.frame(x),as.numeric(x),as.logical(x),as.complex(x),as.character(x),...转换变量类型;使用如下命令可得到全部列表,methods(as) factor():将一个向量转化为一个因子2.变量信息 i原创 2015-09-09 20:33:28 · 1513 阅读 · 0 评论 -
[R语言]Windows环境下快速安装tar.gz包
安装所需:已经安装好R的环境、Rtools、需要安装的tar.gz包1、下载Rtools并安装地址: http://mirror.fcaglp.unlp.edu.ar/CRAN/ 我的R环境为R-3.2.2,所以下载的是Rtools33.exe。直接安装,它会自动配置好环境变量的。 2、拷贝包到C:\Program Files\R\R-2.14.2\bin\i386下。运行cmd(Win+R 键原创 2015-09-18 16:15:23 · 7001 阅读 · 0 评论 -
[R语言]文本分类(2)
上一节,介绍了R语言,和本人做文本分类时运用的几个包,还有个小例子。 这一节就用代码来简单介绍下我做文本分类的过程。我的分类很简单,就是给你一段文字,你将它分类到特定的类别。当然,这是前提是需要大量的语料库,且已经分好类。可以理解为运用监督学习的方法吧。不过我的类别较多,不是二元分类,但是目前的分类器都是二元的,二元的可以改造成多元分类器。有One to One 和 One to the othe原创 2015-10-29 17:16:12 · 2522 阅读 · 0 评论 -
[R语言]文本分类(1)
因项目需要,结合自身专业知识,故而接触了R语言及一些常用分类器。记录下自己这一个多月的学习历程。R语言与起源于贝尔实验室的s语言类似,R也是一种为统计计算和绘图而生的语言和环境,它是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。R是一门脚本语言,在绘图方面有着非常强的能力,它可以让你集中到你要设计的逻辑上来,而不必太过纠结于代码的实现。它的包实在太丰富,几乎能满足你全部的需要。原创 2015-10-29 15:07:33 · 2059 阅读 · 0 评论 -
[R语言]文本分类(3)
在上一节中,已经生成了我所需要的语料库。接下来就可以分类了:直接上代码:library(tm)library(maxent)traindata <- data.frame(NULL)testdata <- data.frame(NULL)#循环测试for(i in 1:10){ filename <- paste(i,'.txt',sep="") text = read.table(原创 2015-10-29 18:24:18 · 1155 阅读 · 0 评论 -
[R语言]字符串处理
转载:http://blog.csdn.net/duqi_yc/article/details/9817243处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本。R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要强多少倍。幸运的是R语言的可扩展能力很强,DNA/RNA/AA等生物序列现在已经可以使用R来处理。R语言处理文本的能转载 2015-12-01 14:08:19 · 1825 阅读 · 0 评论