- 博客(2)
- 资源 (14)
- 收藏
- 关注
原创 MMSEG分词算法
最近在研究文本挖掘相关工具和知识,在对文档(文本文件、Word文件、网页等)能够进行全文检索或数据挖掘前,需要首先进行预处理,使之能够成为相对标准的基础数据,“分词”(Word Segmentation)是进行文档预处理过程中的一项重要工作,特别是对中文,由于中文与英文不同,中文只是字、句和段能通过明显的分界符来简单划界,但是词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一
2015-02-22 22:15:50 1004
转载 全文检索的基本原理
这篇文章写的非常棒,作为一个技术背景的人员,文字功底深厚,逻辑表达清晰,佩服。 原文地址:http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623594.html ------------------------------------------------------------------------------------
2015-02-12 09:36:09 2261 1
障按病种分值付费DIP病种目录
2020-11-24
模拟压力表ActiveX控件源代码
2013-07-27
富士通虚拟桌面白皮书
2012-12-04
微软针对VDI桌面相关政策(Microsoft VDI and Windows VDA FAQ )
2012-11-13
Windows XP 支持多核补丁
2012-11-13
DTLS(DatagramTLS)升级包
2012-10-31
微软RDP8.0升级包(支持Window 7 SP1和Windows Server 2008 R2 SP1))
2012-10-31
qemu参数说明
2011-12-29
Service-Oriented Architecture: Concepts, Technology, and Design
2009-04-06
DB2 SQL PL介绍
2008-06-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人