读书笔记(1) "the text mining handbook"

 

 

7月份开始,要开始读这本由Ronen FeldmanJames Sanger写的《The Text Mining Handbook》。正好学校似乎对于我们在方向的把握能力上相当放心,基本在学了一些没什么用处的课程后,就不再为我们指导什么了。

 

当然,因导师而异,除非导师们也都是半瓶水晃荡。不说了。。。

 

0 前言

0.1.             TM(Text Mining, 文本挖掘) 的目标: 解决信息量过载问题。即信息量爆炸,现有的搜索引擎或者检索工具,只是在输入关键词后提供更多的查询结果。恶化了由信息爆炸带来的问题。

 

0.2.             TM 数据挖掘DM,机器学习ML,自然语言处理NLP,信息检索IR,知识管理KM相关。使用了其中的某几项技术。TM就像好多其他科目,比如知识工程等等,不断的结合好几个领域的内容,演变而来。

 

0.3.             TM的处理客体是文档集合(document collection),包括:文档集合预处理(分类、聚类、信息提取、术语提取等),中间表述存储,中间表述分析,可视化结果等。

 

 这就是前言中有用的地方了。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值