![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP-自然语言处理
文章平均质量分 53
txHe
这个作者很懒,什么都没留下…
展开
-
[NLP]自然语言理解概述
语言是人类有别于其他动物的一个重要标志。自然语言是区别于形式语言或人工语言(如逻辑语言和编程语言等)的人际交流的口头语言(语音)和书面语言(文字)。1、语言与语言理解语言是人类进行通信的自然媒介,它包括口语、书面语以及形体语(如哑语和旗语)等。一种比较正规的提法是:语言是用于传递信息的表示方法、约定和规则的集合。语言由语句组成,每个语句又由单词组成;组成语句和语言时,应遵循一定的语法与语义规则。语言原创 2015-07-16 15:59:13 · 2513 阅读 · 0 评论 -
[R语言]文本分类(1)
因项目需要,结合自身专业知识,故而接触了R语言及一些常用分类器。记录下自己这一个多月的学习历程。R语言与起源于贝尔实验室的s语言类似,R也是一种为统计计算和绘图而生的语言和环境,它是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。R是一门脚本语言,在绘图方面有着非常强的能力,它可以让你集中到你要设计的逻辑上来,而不必太过纠结于代码的实现。它的包实在太丰富,几乎能满足你全部的需要。原创 2015-10-29 15:07:33 · 2059 阅读 · 0 评论 -
[R语言]文本分类(2)
上一节,介绍了R语言,和本人做文本分类时运用的几个包,还有个小例子。 这一节就用代码来简单介绍下我做文本分类的过程。我的分类很简单,就是给你一段文字,你将它分类到特定的类别。当然,这是前提是需要大量的语料库,且已经分好类。可以理解为运用监督学习的方法吧。不过我的类别较多,不是二元分类,但是目前的分类器都是二元的,二元的可以改造成多元分类器。有One to One 和 One to the othe原创 2015-10-29 17:16:12 · 2522 阅读 · 0 评论 -
[R语言]文本分类(3)
在上一节中,已经生成了我所需要的语料库。接下来就可以分类了:直接上代码:library(tm) library(maxent)traindata <- data.frame(NULL) testdata <- data.frame(NULL)#循环测试 for(i in 1:10) { filename <- paste(i,'.txt',sep="") text = read.table(原创 2015-10-29 18:24:18 · 1155 阅读 · 0 评论