机器学习
左边右
这个作者很懒,什么都没留下…
展开
-
机器学习自学入门相关推荐
个人感觉看了有收获的:《数学之美》原创 2014-04-30 15:16:12 · 481 阅读 · 0 评论 -
基于LDA模型的文本聚类研究
2011年1月10日实验室2009级成员董靖灵做了关于基于LDA模型的文本聚类研究的报告,该报告从四个方面介绍了该方向上的工作:1、语义知识在文本聚类中的应用;2、基于LDA模型的文本聚类;3、实验数据分析;4、进一步的工作。具体内容如下: 1.语义知识在文本聚类中的应用 1.1.为什么要引入语义知识 1、聚类是一种无监督的学习方法;转载 2014-04-29 12:56:24 · 1868 阅读 · 0 评论 -
10大经典数据挖掘方法
1.C4.5算法分类技术是数据挖掘算法中经常使用的工具。这些系统将一系列案例作为输入,每个案例属于不同的类别。并且,每个案例都有自己的属性值相对应,系统产生一个分类器能够预测一个新的案例的类别。C4.5算法是ID3算法的扩展,它能够产生用决策树表示的分类器,而且它还可以通过更加容易理解的规则集形式来表示分类器。2.Kmeans算法Kmeans算法是一种简单的迭代算法,它能够将给定的转载 2014-04-29 13:00:03 · 677 阅读 · 0 评论 -
常见面试之机器学习算法思想简单梳理
前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大。 纵观IT行业的招聘岗位,机器学习之类的岗转载 2014-05-14 14:32:24 · 675 阅读 · 0 评论 -
TFIDF算法java实现
一、算法简介 TF-IDF(term frequency–inverse document frequency)。 TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TFIDF实际上是:TF*IDF,TF词频(Term Frequency),IDF反文档频率(I转载 2014-04-29 12:58:20 · 720 阅读 · 0 评论 -
机器学习中的数学
从大学到现在,课堂上学的和自学的数学其实不算少了,可是在研究的过程中总是发现需要补充新的数学知识。Learning和Vision都是很多种数学的交汇场。看着不同的理论体系的交汇,对于一个researcher来说,往往是非常exciting的enjoyable的事情。不过,这也代表着要充分了解这个领域并且取得有意义的进展是很艰苦的。记得在两年前的一次blog里面,提到过和learning有关的数学。转载 2014-04-29 13:03:34 · 396 阅读 · 0 评论 -
隐马尔科夫模型
隐马尔可夫模型 (Hidden Markov Model,HMM) 最初由 L. E. Baum 和其它一些学者发表在一系列的统计学论文中,随后在语言识别,自然语言处理以及生物信息等领域体现了很大的价值。平时,经常能接触到涉及 HMM 的相关文章,一直没有仔细研究过,都是蜻蜓点水,因此,想花一点时间梳理下,加深理解,在此特别感谢 52nlp 对 HMM 的详细介绍。 考虑下面交通灯的转载 2014-05-13 12:50:51 · 634 阅读 · 0 评论 -
数学之美番外篇:平凡而又神奇的贝叶斯方法
概率论只不过是把常识用数学公式表达了出来。——拉普拉斯记得读本科的时候,最喜欢到城里的计算机书店里面去闲逛,一逛就是好几个小时;有一次,在书店看到一本书,名叫贝叶斯方法。当时数学系的课程还没有学到概率统计。我心想,一个方法能够专门写出一本书来,肯定很牛逼。后来,我发现当初的那个朴素归纳推理成立了——这果然是个牛逼的方法。——题记目录0. 前言 1. 历史转载 2014-05-07 12:26:48 · 718 阅读 · 0 评论 -
kmeans算法java实现
K-MEANS算法: k-means 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。k-means 算法的工作过程说明如下:首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据转载 2014-04-29 13:22:00 · 558 阅读 · 0 评论