NLP
文章平均质量分 77
CodeCops
Humachine is the ultimate shape of human beings.
展开
-
学习《Automatic Text Categorization by Unsupervised Learning》笔记
目前主流的文本分类都是通过一些预先定义好的打标数据来对新文本进行分类。而且,文本分类的精确程度,往往是取决于打标数据的多少和分类质量。这就有点鸡生蛋,蛋生鸡的味道了。要是我们话费巨量时间去打标数据,还需要机器干嘛。更多时候,我们的数据可能还很奇怪,打标的分类并不是均衡的,生成打标数据很有困难。这篇Ko Young Joong和Seo Jung Yun合写的文章正是针对这个困难,提出了一种他们认为比原创 2016-11-17 14:02:09 · 469 阅读 · 0 评论 -
文本数据的机器学习自动分类方法(上)
原文链接:http://www.infoq.com/cn/articles/machine-learning-automatic-classification-of-text-data 编者按】:随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。以统计理论为基础,利用机器学习算法转载 2016-11-25 15:06:30 · 1083 阅读 · 0 评论 -
文本数据的机器学习自动分类方法(下)
原文链接:http://www.infoq.com/cn/articles/machine-learning-automatic-classification-of-text-data-part2编者按】:随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。以统计理论为基础,利用机转载 2016-11-25 15:13:46 · 1043 阅读 · 0 评论