数据挖掘
文章平均质量分 77
CodeCops
Humachine is the ultimate shape of human beings.
展开
-
如何自学成为“数据挖掘”的高手
对比我自己过去两年的学习和实践,我自己觉得不一定要全部看完入门,完全可以在某一个方向上面深入,包括一些数学知识,也是遇到了就去看,所以一些看上去很简单的算法和饮用,可能要花很长时间才能读通。可是,你第二次再遇到类似的算法,你就会很快领会。如果你是菜鸟:1.读书学习:a.《Introduction to Data Mining》,这本书很浅显易懂,没有复杂高深的公式,很合适入门的转载 2016-08-26 21:02:37 · 665 阅读 · 0 评论 -
学习《Automatic Text Categorization by Unsupervised Learning》笔记
目前主流的文本分类都是通过一些预先定义好的打标数据来对新文本进行分类。而且,文本分类的精确程度,往往是取决于打标数据的多少和分类质量。这就有点鸡生蛋,蛋生鸡的味道了。要是我们话费巨量时间去打标数据,还需要机器干嘛。更多时候,我们的数据可能还很奇怪,打标的分类并不是均衡的,生成打标数据很有困难。这篇Ko Young Joong和Seo Jung Yun合写的文章正是针对这个困难,提出了一种他们认为比原创 2016-11-17 14:02:09 · 470 阅读 · 0 评论 -
文本数据的机器学习自动分类方法(上)
原文链接:http://www.infoq.com/cn/articles/machine-learning-automatic-classification-of-text-data 编者按】:随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。以统计理论为基础,利用机器学习算法转载 2016-11-25 15:06:30 · 1084 阅读 · 0 评论 -
文本数据的机器学习自动分类方法(下)
原文链接:http://www.infoq.com/cn/articles/machine-learning-automatic-classification-of-text-data-part2编者按】:随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。以统计理论为基础,利用机转载 2016-11-25 15:13:46 · 1050 阅读 · 0 评论