机器学习
文章平均质量分 70
nanjunxiao
这个作者很懒,什么都没留下…
展开
-
logistic 回归模型
转载自:http://www.hxxiaopei.com/?p=117logistic regression是统计学习中经典的分类算法,属于对数线性模型。回归模型:给定一个数据集合(x1,y1)(x2,y2)...(xn,yn),有监督学习构建模型,学习过程就是模型参数θ的学习过程。作为discrimination algorithm,对 P(Y|X;θ)建模,转载 2012-09-04 21:23:52 · 1413 阅读 · 0 评论 -
LIBSVM使用介绍
1.首先从主页上下载libsvm、Python2.5.2和gnuplot 三个软件。 http://www.csie.ntu.edu.tw/~cjlin/ 2.准备好数据,首先要把数据转换成Libsvm软件包要求的数据格式为: label index1:value1 index2:value2 ... 其中对于分类来说label为类标识,指定数据的种类 ;对于回归来说lab转载 2013-06-04 22:14:30 · 1380 阅读 · 0 评论 -
svm-light和libsvm比较
http://hi.baidu.com/superdxf/blog/item/b169cc1686d38a4f21a4e9ee.html最近用了这两种software去测试打手机,发觉svmlight速度比较快,准确率还可以,而且便于操作,而libsvm在train的时候速度不够快,而且操作起来挺麻烦,更重要的是在c++中测试单个图片的时候非常慢,一张576*720的图片要费3秒左右的时间,几转载 2013-06-04 22:09:57 · 6299 阅读 · 0 评论 -
Latent Dirichlet Allocation (LDA)- David M.Blei
一、预备知识: 1. 概率密度和二项分布、多项分布,在这里 2. 狄利克雷分布,在这里,主要内容摘自《Pattern Recognition and Machine Learning》第二章 3. 概率图模型,在PRML第九章有很好的介绍二、变量表示: 1. word:word是最基本的离散概念,在自然语言处转载 2013-06-03 00:18:25 · 3904 阅读 · 0 评论 -
主题模型-LDA小结
一.主题模型传统判断两个文档相似性的方法是通过查看两个文档共同出现的单词的多少,如TF-IDF等,这种方法没有考虑到文字背后的语义关联,可能在两个文档共同出现的单词很少甚至没有,但两个文档是相似的。 举个例子,有两个句子分别如下: “乔布斯离我们而去了。” “苹果价格会不会降?”原创 2013-06-02 16:09:45 · 23566 阅读 · 2 评论 -
LDA论文导读
转载自:http://www.xperseverance.net/blogs/2012/03/16/ 有两种方法设计分类器: 1. discriminative model,就是由样本直接设计判别函数,例如SVM; 2. generative model,就是先从样本恢复概率模型——例如我们熟悉的参数方法:混合高斯模型GMM;非参数方法Parzen窗转载 2013-06-02 23:29:40 · 2308 阅读 · 0 评论 -
学习排序 Learning to Rank 小结
学习排序(Learning to Rank)LTR(Learning torank)学习排序是一种监督学习(SupervisedLearning)的排序方法。LTR已经被广泛应用到文本挖掘的很多领域,比如IR中排序返回的文档,推荐系统中的候选产品、用户排序,机器翻译中排序候选翻译结果等等。IR领域传统的排序方法一般通过构造相关度函数,然后按照相关度进行排序。影响相关度的因素很多,比如上面提到的原创 2013-05-26 12:14:09 · 81094 阅读 · 3 评论 -
检索模型及评价指标小结
经典检索模型信息检索模型从它诞生到现在经历了几个不同阶段,分别是基于集合论、基于线性代数、基于统计和概率阶段。虽然专家检索不同于传统的信息检索,但两者还是有很大关联,并且本文也将基于对专家描述文档的检索作为Baseline,作为后续优化的基础。因此了解传统检索模型是很有必要的,本文下面将对不同阶段的经典模型进行摘要性介绍。2.1.1.1 布尔模型布尔模型是一个简单但却优雅的模型,原创 2013-05-26 12:24:43 · 8684 阅读 · 2 评论