读书笔记（1） "the text mining handbook"

最新推荐文章于 2023-01-21 13:57:03 发布

两把扇子

最新推荐文章于 2023-01-21 13:57:03 发布

阅读量1.1k

点赞数

分类专栏： old_golden_times 文章标签：读书自然语言处理数据挖掘文档搜索引擎工具

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dobest9014/article/details/5708335

版权

old_golden_times 专栏收录该内容

62 篇文章 0 订阅

订阅专栏

从7月份开始，要开始读这本由Ronen Feldman和James Sanger写的《The Text Mining Handbook》。正好学校似乎对于我们在方向的把握能力上相当放心，基本在学了一些没什么用处的课程后，就不再为我们指导什么了。

当然，因导师而异，除非导师们也都是半瓶水晃荡。不说了。。。

0 前言

0.1. TM(Text Mining, 文本挖掘) 的目标：解决信息量过载问题。即信息量爆炸，现有的搜索引擎或者检索工具，只是在输入关键词后提供更多的查询结果。恶化了由信息爆炸带来的问题。

0.2. TM 与数据挖掘DM，机器学习ML，自然语言处理NLP，信息检索IR，知识管理KM相关。使用了其中的某几项技术。TM就像好多其他科目，比如知识工程等等，不断的结合好几个领域的内容，演变而来。

0.3. TM的处理客体是文档集合（document collection），包括：文档集合预处理（分类、聚类、信息提取、术语提取等），中间表述存储，中间表述分析，可视化结果等。

这就是前言中有用的地方了。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。