文本挖掘
zxsted
这个作者很懒,什么都没留下…
展开
-
PyMining-开源中文文本数据挖掘平台 Ver 0.1发布
http://code.google.com/p/python-data-mining-platform/ (可能需翻墙)目前已经在该googlecode中加入了Tutorial等内容,可以在wiki中查看项目介绍(复制自项目首页的说明):这是一个能够根据源数据(比如说用csv格式表示的矩阵,或者中文文档)使用多种多样的算法去得到结果的一个平台。 算法能够转载 2013-12-03 20:25:22 · 512 阅读 · 0 评论 -
支持中文文本的数据挖掘平台开源项目PyMining发布
前言 最近一个月,过年的时候天天在家里呆着,年后公司的事情也不断,有一段时间没有更新博客了。PyMining是我最近一段时间构思的一个项目,虽然目前看来比较微型。该项目主要是针对中文文本的数据挖掘算法的实验与应用。从项目的目标来说,希望使用者可以很方便的使用现有的数据挖掘、机器学习算法与添加需要的算法。项目概述 项目目前主要关注中文文本的数据挖掘算法。由于每种数转载 2013-12-03 21:00:11 · 907 阅读 · 0 评论 -
文本挖掘过程(Text Mining)
一、文本挖掘概念 在现实世界中,可获取的大部信息是以文本形式存储在文本数据库中的,由来自各种数据源的大量文档组成,如新闻文档、研究论文、书籍、数字图书馆、电子邮件和Web页面。由于电子形式的文本信息飞速增涨,文本挖掘已经成为信息领域的研究热点。 文本数据库中存储的数据可能是高度非结构化的,如WWW上的网页;也可能是半结构化的,如e-mail消息和一些XML网页:而其它的则可能是转载 2013-12-03 20:22:34 · 5328 阅读 · 0 评论