文本挖掘
文章平均质量分 80
sky1203850702
所有的好走的路都是下坡
展开
-
文本分类概述
概览 自动文本分类(Automatic Text Categorization),或者简称为文本分类,是指计算机将一篇文章归于预先给定的某一类或某几类的过程。 文本分类是指按照预先定义的主题类别,为文档集合中的每个文档确定一个类别.文本分类是文本挖掘的一个重要内容。 所谓文本分类,是指对所给出的文本,给出预定义的一个或多个类别标号,对文本进行准确、高效的分类.它是许多数据管理任务转载 2015-01-29 18:16:34 · 2576 阅读 · 0 评论 -
支持中文文本的数据挖掘平台开源项目PyMining发布
本文转自http://www.cnblogs.com/LeftNotEasy/archive/2011/02/27/py_mining_first_release.html 前言 最近一个月,过年的时候天天在家里呆着,年后公司的事情也不断,有一段时间没有更新博客了。PyMining是我最近一段时间构思的一个项目,虽然目前看来比较微型。该项目主要是针对中文文本的数据挖掘算法转载 2015-01-29 16:57:00 · 2300 阅读 · 0 评论 -
python xml.etree.ElementTree解析
简介 Element类型是一种灵活的容器对象,用于在内存中存储结构化数据。 [注意]xml.etree.ElementTree模块在应对恶意结构数据时显得并不安全。 每个element对象都具有以下属性: 1. tag:string对象,表示数据代表的种类。 2. attrib:dictionary对象,表示附有的属性。 3. text:string原创 2015-06-09 12:57:54 · 12475 阅读 · 0 评论