- 博客(5)
- 收藏
- 关注
转载 回归(regression)、梯度下降(gradient descent)
回归与梯度下降: 回归在数学上来说是给定一个点集,能够用一条曲线去拟合之,如果这个曲线是一条直线,那就被称为线性回归,如果曲线是一条二次曲线,就被称为二次回归,回归还有很多的变种,如locally weighted回归,logistic回归,等等,这个将在后面去讲。 用一个很简单的例子来说明回归,这个例子来自很多的地方,也在很多的open source的软件中看到,比如说w
2013-10-29 17:27:35 663
转载 浅谈语义主题计算
摘要:两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文字间的语义主题。近些年来各大互联网公司都开始了这方面的探索和尝试。就让我们看一下究竟吧。
2013-10-18 11:46:56 1993
转载 LDA模型学习之贝叶斯公式
近几天在学习LDA模型。真的是让人纠结!都看了两天了,不知所云!看到网上一大牛说:“其实这个模型不难理解”真的想吐血!想想也释然了:好歹也比我多读了八年书嘛!八年,日本鬼子也搞定了,别说一个小小的模型。 好了,抱怨一下也就可以了,模型还是得研究的! 从贝叶斯开始吧! 把已经出尘脱俗的《概率论》翻出来,好好看了一个上午:感觉不难理解。
2013-10-18 10:58:32 5832
转载 LDA主题聚类学习小结
LDA主题聚类学习小结0人收藏此文章, 我要收藏发表于13天前(2013-10-01 21:40) , 已有37次阅读 ,共0个评论目录:[ - ]LDA模型算法简介:LDA模型构建原理:Unigram Model(词袋模型):Bayes Unigram Model(贝叶斯词袋模型)PLSA潜在语义分析LDA主题聚类模型LDA 算法设计
2013-10-14 15:49:07 17495 2
转载 Mahout聚类中距离度量
Mahout聚类中距离度量7.4 Exploring distance measures(距离度量扩展)在上面的简单聚类示例中,我们用的是EuclideanDistanceMeasure(欧式距离)来计算点之间的距离。虽然它在我们上节的聚类实例中被证明是有效的度量方法,但在Mahout包中还有其他相似的度量方法实现。这些类被命名为 DistanceMeasure(距离度量) 的实现
2013-10-10 10:51:12 1949
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人