自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

转载 回归(regression)、梯度下降(gradient descent)

回归与梯度下降:   回归在数学上来说是给定一个点集,能够用一条曲线去拟合之,如果这个曲线是一条直线,那就被称为线性回归,如果曲线是一条二次曲线,就被称为二次回归,回归还有很多的变种,如locally weighted回归,logistic回归,等等,这个将在后面去讲。   用一个很简单的例子来说明回归,这个例子来自很多的地方,也在很多的open source的软件中看到,比如说w

2013-10-29 17:27:35 663

转载 浅谈语义主题计算

摘要:两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文字间的语义主题。近些年来各大互联网公司都开始了这方面的探索和尝试。就让我们看一下究竟吧。

2013-10-18 11:46:56 1993

转载 LDA模型学习之贝叶斯公式

近几天在学习LDA模型。真的是让人纠结!都看了两天了,不知所云!看到网上一大牛说:“其实这个模型不难理解”真的想吐血!想想也释然了:好歹也比我多读了八年书嘛!八年,日本鬼子也搞定了,别说一个小小的模型。     好了,抱怨一下也就可以了,模型还是得研究的! 从贝叶斯开始吧!      把已经出尘脱俗的《概率论》翻出来,好好看了一个上午:感觉不难理解。

2013-10-18 10:58:32 5832

转载 LDA主题聚类学习小结

LDA主题聚类学习小结0人收藏此文章, 我要收藏发表于13天前(2013-10-01 21:40) , 已有37次阅读 ,共0个评论目录:[ - ]LDA模型算法简介:LDA模型构建原理:Unigram Model(词袋模型):Bayes Unigram Model(贝叶斯词袋模型)PLSA潜在语义分析LDA主题聚类模型LDA 算法设计

2013-10-14 15:49:07 17495 2

转载 Mahout聚类中距离度量

Mahout聚类中距离度量7.4 Exploring distance measures(距离度量扩展)在上面的简单聚类示例中,我们用的是EuclideanDistanceMeasure(欧式距离)来计算点之间的距离。虽然它在我们上节的聚类实例中被证明是有效的度量方法,但在Mahout包中还有其他相似的度量方法实现。这些类被命名为 DistanceMeasure(距离度量) 的实现

2013-10-10 10:51:12 1949

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除