文本挖掘系列
文章平均质量分 87
星火缘2016
这个作者很懒,什么都没留下…
展开
-
文本挖掘系列之文本分类
文本分类介绍文本分类问题是根据文本的特征将其分到预先设定好的类别中,类别可以是两类,也可以是更多的类别。文本分类是机器学习领域里监督学习的一种重要应用问题。不过需要指出的是,第一,文本分类问题中用于构建文本自动分类系统的文本类别体系是已经确定的。类别系统一旦变化,需要重新构建新的文本分类系统;第二,在文本分类问题中,并没有特别要求一篇文本只能属于某一个类别,例如,根据主题的分类中每篇文本可能会被分到原创 2017-06-18 17:40:07 · 7003 阅读 · 0 评论 -
文本挖掘系列之文本信息抽取
文本数据挖掘的定义文本数据挖掘是一种利用计算机处理技术从文本数据中抽取有价值的信息和知识的应用驱动型学科。文本数据挖掘处理的数据类型是文本数据,属于数据挖据的一个分支,与机器学习、自然语言处理、数理统计等学科具有紧密联系。文本挖掘在很多应用中都扮演重要角色,例如智能商务(例如客户关系管理)、信息检索(例如互联网搜索)等。 文本数据挖掘需要从三个层面进行理解。其一,底层技术,文本挖掘作为数据挖掘的一原创 2017-06-07 12:52:31 · 31152 阅读 · 0 评论