MachineLearningInAction
文章平均质量分 58
我是一只小兔纸咿呀咿呀呦
To be a better me
展开
-
数据挖掘概念与技术——
http://blog.csdn.net/zhucanxiang/article/details/9843901原创 2015-03-19 11:42:08 · 625 阅读 · 0 评论 -
机器学习中的相似性度量
http://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性转载 2015-07-13 21:54:39 · 376 阅读 · 0 评论 -
深入理解拉格朗日乘子法(Lagrange Multiplier) 和KKT条件
http://blog.csdn.net/xianlingmao/article/details/7919597在求取有约束条件的优化问题时,拉格朗日乘子法(Lagrange Multiplier) 和KKT条件是非常重要的两个求取方法,对于等式约束的优化问题,可以应用拉格朗日乘子法去求取最优值;如果含有不等式约束,可以应用KKT条件去求取。当然,这两个方法求得的结果只是必要条件,只有转载 2015-05-17 10:45:16 · 451 阅读 · 0 评论 -
tile 与 repeat的区别
http://www.aichengxu.com/view/15527两者都是用于扩充数组,但是repeat扩充的是以元素为单位,tile是以数组为单位原创 2015-04-28 13:34:43 · 1040 阅读 · 0 评论 -
python中的矩阵操作
m*n矩阵aa.sum(axis = 1),即是求矩阵a每一行的元素之和,得到的矩阵为m行1列a ** k意思是针对矩阵a中的每个元素,求其k次方,得到的矩阵依旧为m行n列在python用import或者from...import来导入相应的模块。模块其实就是一些函数和类的集合文件,它能实现一些相应的功能,当我们需要使用这些功能的时候,直接把相应的模块导入到我们的程原创 2015-04-28 14:03:54 · 2967 阅读 · 0 评论 -
矩阵归一化
a是一个m*n矩阵; b = a.min(para): 当para等于0时,b是一个1*n矩阵,是矩阵a每一列的最小值组成的矩阵;当para等于1时,b是一个1*m矩阵,是矩阵a每一行的最小值组成的矩阵;max同理!!!原创 2015-05-10 15:32:37 · 2475 阅读 · 0 评论 -
MIA------KNN
#encoding:utf-8'''Created on 2015年4月28日@author: zju'''from numpy import *import operatordef createDataSet(): group = array([[1.0, 1.1], [1.0, 1.0], [0, 0], [0, 0.1]]) labels = ['A', '原创 2015-05-10 16:14:48 · 434 阅读 · 0 评论 -
Petuum源码解析
http://yinxusen.github.io/blog/2014/01/17/petuum-source-code-read-and-initial-test-result/Petuum: Source Code Read and Initial Test ResultJAN 17TH, 2014这几天为了测好Petuum,花了一点时间看了一下Petu转载 2015-05-08 20:22:08 · 1868 阅读 · 0 评论 -
petuum
http://www.cnblogs.com/wei-li/p/3786411.html十分钟了解分布式计算:PetuumPetuum是一个机器学习专用分布式计算框架,本文介绍其架构,并基于文章 More Effective Distributed ML via a Stale Synchronous Parallel Parameter Server,NIPS 2013转载 2015-05-08 19:59:58 · 1550 阅读 · 0 评论 -
Myrrix
一、http://www.open-open.com/lib/view/open1372168198150.htmlMyrrix是一个完整的、实时的、可扩展的集群和推荐系统,基于Mahout实现。主要架构分为两部分:服务层:在线服务,响应请求、数据读入、提供实时推荐;计算层:用于分布式离线计算,在后台使用分布式机器学习算法为服务层 更新机器学习模型。Myrrix使用这两个层转载 2015-05-08 19:49:22 · 1418 阅读 · 0 评论 -
Dodo
http://blog.163.com/jiayouweijiewj%40126/blog/static/1712321772011816101625959/一 基于云计算的海量数据挖掘 2008年7 月,《Communications of the ACM》杂志发表了关于云计算的专辑,云计算因其清晰的商业模式而受到广泛关注,并得到工业和学术界的普遍认可。目前工业界推出的云计算转载 2015-05-08 19:44:03 · 569 阅读 · 0 评论 -
推荐系统开源软件列表汇总
http://blog.csdn.net/cserchen/article/details/14231153我收集和整理的目前互联网上所能找到的知名开源推荐系统(open source project for recommendation system),并附上了个人的一些简单点评(未必全面准确),这方面的中文资料很少见,希望对国内的朋友了解掌握推荐系统有帮助转载 2015-05-08 19:34:20 · 614 阅读 · 0 评论 -
Oryx
http://www.oschina.net/p/oryxOryx的目标是帮助Hadoop用户搭建并部署能够实时查询的机器学习模型,例如垃圾邮件过滤和推荐引擎。随着数据的不断流入,Oryx还将支持自我更新。无论从建模还是部署,Oryx都可以随需扩展,Owen认为这是Oryx与Hadoop的传统“甜蜜点”——探索性分析和运营性分析最大的不同。Owen认为传统的在Hadoo转载 2015-05-08 19:43:09 · 1051 阅读 · 0 评论 -
C4.5
http://blog.csdn.net/xuxurui007/article/details/18045943C4.5对ID3算法有一下4点改进:1)用信息增益率来选择属性,克服了洗没洗增益选择属性时偏向选择去之多的属性的不足;2)在树构造过程中进行剪枝;3)能够完成对连续属性的离散化处理;4)能够对不完整数据进行处理;http://www.cnblogs.com原创 2015-03-19 21:42:06 · 666 阅读 · 0 评论 -
mahout中kmeans算法和Canopy算法实现原理
http://www.cnblogs.com/yuhan-TB/p/3380153.html本文讲一下mahout中kmeans算法和Canopy算法实现原理。 一. Kmeans是一个很经典的聚类算法,我想大家都非常熟悉。虽然算法较为简单,在实际应用中却可以有不错的效果;其算法原理也决定了其比较容易实现并行化。学习mahout就先从简单的kmeans算法开始学转载 2015-07-13 21:58:15 · 659 阅读 · 0 评论