机器学习
hermito
这个作者很懒,什么都没留下…
展开
-
局部敏感哈希(Locality-Sensitive Hashing, LSH)
from:http://blog.csdn.net/icvpr/article/details/12342159本文主要介绍一种用于海量高维数据的近似最近邻快速查找技术——局部敏感哈希(Locality-Sensitive Hashing, LSH),内容包括了LSH的原理、LSH哈希函数集、以及LSH的一些参考资料。一、局部敏感哈希LSH在很多转载 2016-06-15 14:50:06 · 707 阅读 · 0 评论 -
Kaggle入门(数字识别为例)
from:http://blog.csdn.net/u012162613/article/details/41929171这篇文章适合那些刚接触Kaggle、想尽快熟悉Kaggle并且独立完成一个竞赛项目的网友,对于已经在Kaggle上参赛过的网友来说,大可不必耗费时间阅读本文。本文分为两部分介绍Kaggle,第一部分简单介绍Kaggle,第二部分将展示解决一个竞赛项目的全过程转载 2016-07-08 17:28:00 · 5669 阅读 · 2 评论 -
关于协方差和马氏距离的理解
整理了几篇看着不错的博客。统计学的基本概念方差:很显然,均值描述的是样本集合的中间点,它告诉我们的信息是很有限的,而标准差给我们描述的则是样本集合的各个样本点到均值的距离之平均。以这两个集合为例,[0,8,12,20]和[8,9,11,12],两个集合的均值都是10,但显然两个集合差别是很大的,计算两者的标准差,前者是8.3,后者是1.8,显然后者较为集中,故其标准差小一些,标准差转载 2015-09-01 11:24:57 · 9603 阅读 · 0 评论 -
METRIC LEARNING(度量学习)
度量学习也可以认为是相似度。knn最合适的是学习马氏距离,怎么学?要给出先验知识,哪两个数据更相似,欧式距离不可靠。SVM也是metric learning的一种,因为kernel matrix就是相似度。state of art的metric learning方法LMNN,有代码可以下载。也未必效果最好,用得很多,因为有代码。度量就是相似度,任何方法只要用到相似度,就可以用到度量学习。度量学转载 2015-01-27 14:23:32 · 2555 阅读 · 0 评论 -
分类算法评价标准
一、引言分类算法有很多,不同分分类算法又用很多不同的变种。不同的分类算法有不同的特定,在不同的数据集上表现的效果也不同,我们需要根据特定的任务进行算法的选择,如何选择分类,如何评价一个分类算法的好坏,前面关于决策树的介绍,我们主要用的正确率(accuracy)来评价分类算法。正确率确实是一个很好很直观的评价指标,但是有时候正确率高并不能代表一个算法就好。比如某个地区某天地震的预测,转载 2016-04-06 17:24:07 · 16539 阅读 · 0 评论 -
距离度量的表示法
1. 欧氏距离,最常见的两点之间或多点之间的距离表示法,又称之为欧几里得度量,它定义于欧几里得空间中,如点 x = (x1,...,xn) 和 y = (y1,...,yn) 之间的距离为:(1)二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离:(2)三维空间两点a(x1,y1,z1)与b(x2,y2,z2)间转载 2014-11-10 22:27:27 · 11190 阅读 · 0 评论 -
迁移学习(Transfer Learning)
FROM: http://www.zhizhihu.com/html/y2009/790.html在机器学习领域,迁移学习(Transfer learning)是一个比较新的名词。目前国内做这个方面的很少,我目前只知道香港科技大学杨强教授及上海交大的机器学习小组在从事这方面的研究,近几年他们已经取得大量的成果,发表了十几篇AI领域顶级的会议论文,着实让我崇拜不已。接下来的研究生活,偶希望能转载 2015-01-18 09:52:25 · 982 阅读 · 0 评论 -
推荐系统
第 1 部分: 推荐引擎初探https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/第 2 部分: 深入推荐引擎相关算法 - 协同过滤http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy2/第 3 部分原创 2015-01-19 08:48:16 · 560 阅读 · 0 评论 -
模拟退火算法
from:http://blog.csdn.net/acdreamers/article/details/10019849模拟退火算法是用来求解最优化问题的算法。比如著名的TSP问题,函数最大值最小值问题等等。接下来将以如下几个方面来详细介绍模拟退火算法。 Contents 1. 模拟退火算法认识 2. 模拟退火算法描述转载 2016-05-26 14:23:22 · 948 阅读 · 0 评论 -
BP神经网络
from:http://blog.csdn.net/acdreamers/article/details/44657439Contents 1. BP神经网络的认识 2. 隐含层的选取 3. 正向传递子过程 4. 反向传递子过程 5. BP神经网络的注意点 6. BP神经网络的C++实现转载 2016-05-26 14:27:38 · 1066 阅读 · 0 评论 -
Viola Jones Face Detector
论文:Viola P, Jones M.Rapid object detection using a boosted cascade of simple features[C]//Computer Vision and Pattern Recognition, 2001. CVPR 2001. from:http://www.cnblogs.com/hrlnw/archive/2013转载 2016-07-08 17:48:15 · 2723 阅读 · 0 评论