算法
caodaoxi
这个作者很懒,什么都没留下…
展开
-
数据挖掘中所需的概率论与数理统计知识、上
导言:本文从微积分相关概念,梳理到概率论与数理统计中的相关知识,但本文之压轴戏在本文第4节(彻底颠覆以前课本灌输给你的观念,一探正态分布之神秘芳踪,知晓其前后发明历史由来),相信,每一个学过概率论与数理统计的朋友都有必要了解数理统计学简史,因为,只有了解各个定理.公式的发明历史,演进历程.相关联系,才能更好的理解你眼前所见到的知识,才能更好的运用之。前言 一个月余前,在微转载 2012-12-27 16:30:25 · 1831 阅读 · 0 评论 -
从K近邻算法、距离度量谈到KD树、SIFT+BBF算法
前言 前两日,在微博上说:“到今天为止,我至少亏欠了3篇文章待写:1、KD树;2、神经网络;3、编程艺术第28章。你看到,blog内的文章与你于别处所见的任何都不同。于是,等啊等,等一台电脑,只好等待..”。得益于田,借了我一台电脑(借他电脑的时候,我连表示感谢,他说“能找到工作全靠你的博客,这点儿小忙还说,不地道”,有的时候,稍许感受到受人信任也是一种压力,愿我不辜负大家对我的信任转载 2012-12-27 16:32:20 · 778 阅读 · 0 评论 -
Hadoop实例:单轮MapReduce的矩阵乘法
最近开始在看@王斌_ICTIR老师的《大数据:互联网大规模数据挖掘与分布式处理》,下面是对第二章提到的的单轮计算矩阵乘法进行的学习实现过程。 矩阵的乘法只有在第一个矩阵的列数(column)和第二个矩阵的行数(row)相同时才有定义。一般单指矩阵乘积时,指的便是一般矩阵乘积。若A为i×r矩阵,B为r×j矩阵,则他们的乘积AB(有时记做A· B)会是一个i×j矩阵。其乘积矩阵的元素如下转载 2013-01-01 10:38:40 · 467 阅读 · 0 评论 -
希尔排序
package com.cn.izp;public class ShellSort { public void shell_sort(int[] arrays) { for (int d = 5; d > 0; d = d - 2) { for (int c = 0; c for (int i = c原创 2013-03-18 21:38:24 · 452 阅读 · 0 评论 -
java中的BitSet学习
java中的BitSet学习分类: 算法 Java SE2012-08-09 21:50 338人阅读 评论(0)收藏 举报(1)BitSet类 大小可动态改变, 取值为true或false的位集合。用于表示一组布尔标志。 此类实现了一个按需增长的位向量。位 set 的每个组件都有一个 boolean 值。用非负的整转载 2013-05-30 22:31:00 · 565 阅读 · 0 评论 -
如何预测用户query意图
有一个朋友问,一个用户搜索一个query是“百度”,怎么知道用户真正是想找什么呢。我回答说,分析之前搜索这个query的用户点了些什么结果啊。朋友继续问,如果没有用户点击呢。呃,如果没有点击,这个问题就比较复杂了。整理了下思路,于是写成了本文。主要描述了关于如何预测用户query意图。希望会有所帮助。首先我们的明确一个标准,如何判断我们对用户意图的猜测是正确的?用户的思维是很发转载 2013-06-16 13:21:07 · 508 阅读 · 0 评论 -
一致性哈希算法与Java实现
一致性哈希算法是分布式系统中常用的算法。比如,一个分布式的存储系统,要将数据存储到具体的节点上,如果采用普通的hash方法,将数据映射到具体的节点上,如key%N,key是数据的key,N是机器节点数,如果有一个机器加入或退出这个集群,则所有的数据映射都无效了,如果是持久化存储则要做数据迁移,如果是分布式缓存,则其他缓存就失效了。 因此,引入了一致性哈希算法: 把数据用h转载 2013-06-18 17:21:18 · 771 阅读 · 1 评论 -
一致性hash算法 - consistent hashing
consistent hashing算法早在1997年就在论文Consistenthashing and random trees中被提出,目前在cache系统中应用越来越广泛;1基本场景比如你有N个cache服务器(后面简称cache),那么如何将一个对象object映射到N个cache上呢,你很可能会采用类似下面的通用方法计算object的hash值,然后均匀的映射到到N个cache;转载 2013-06-18 17:01:09 · 452 阅读 · 0 评论