自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (20)
  • 收藏
  • 关注

转载 通过Sqoop实现Mysql / Oracle 与HDFS / Hbase互导数据

下文将重点说明通过Sqoop实现Mysql与HDFS互导数据,Mysql与Hbase,Oracle与Hbase的互导最后给出命令。一、Mysql与HDFS互导数据环境:宿主机器操作系统为Win7,Mysql安装在宿主机上,宿主机地址为192.168.66.963台虚拟机操作系统为Ubuntu-12.04.1-32位三台虚拟机已成功安装hadoop,并实现免密钥互访,配hosts

2014-09-21 17:11:49 768

转载 堆与堆排序

堆排序与快速排序,归并排序一样都是时间复杂度为O(N*logN)的几种常见排序方法。学习堆排序前,先讲解下什么是数据结构中的二叉堆。二叉堆的定义二叉堆是完全二叉树或者是近似完全二叉树。二叉堆满足二个特性:1.父结点的键值总是大于或等于(小于或等于)任何一个子节点的键值。2.每个结点的左子树和右子树都是一个二叉堆(都是最大堆或最小堆)。当父结点的键值总

2014-09-12 15:21:36 654

转载 归并排序

归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。首先考虑下如何将将二个有序数列合并。这个非常简单,只要从比较二个数列的第一个数,谁小就先取谁,取了后就在对应数列中删除这个数。然后再进行比较,如果有数列为空,那直接将另一个数列的数据依次取出即可。[cpp] view plaincopy

2014-09-12 13:42:42 748

转载 快速排序

快速排序由于排序效率在同为O(N*logN)的几种排序方法中效率较高,因此经常被采用,再加上快速排序思想----分治法也确实实用,因此很多软件公司的笔试面试,包括像腾讯,微软等知名IT公司都喜欢考这个,还有大大小的程序方面的考试如软考,考研中也常常出现快速排序的身影。总的说来,要直接默写出快速排序还是有一定难度的,因为本人就自己的理解对快速排序作了下白话解释,希望对大家理解有帮助,达到快速

2014-09-12 13:02:57 537

转载 布隆过滤器 (Bloom Filter) 详解

布隆过滤器 (Bloom Filter)是由Burton Howard Bloom于1970年提出,它是一种space efficient的概率型数据结构,用于判断一个元素是否在集合中。在垃圾邮件过滤的黑白名单方法、爬虫(Crawler)的网址判重模块中等等经常被用到。哈希表也能用于判断元素是否在集合中,但是布隆过滤器只需要哈希表的1/8或1/4的空间复杂度就能完成同样的问题。布隆过滤器可以插入元

2014-09-09 10:32:25 880

转载 布隆过滤器(Bloom Filter)Java实现

布隆过滤器原理很简单:就是把一个字符串哈希成一个整数key,然后选取一个很长的比特序列,开始都是0,在key把此位置的0变为1;下次进来一个字符串,哈希之后的值key,如果在此比特位上的值也是1,那么就说明这个字符串存在了。如果按照上面的做法,那就和哈希算法没有什么区别了,哈希算法还有重复的呢。布隆过滤器是将一个字符串哈希成多个key,我还是按照书上的说吧。先建立一个16亿

2014-09-09 10:29:51 1349

The Google file system(免积分下载)

The Google file system,一个分布式文件系统,隐藏下层负载均衡,冗余复制等细节,对上层程序提供一个统一的文件系统API接口

2014-01-04

CentOS下Hadoop-0.20.2集群配置文档 免积分下载

CentOS下Hadoop-0.20.2集群配置文档 免积分下载

2013-12-05

HMM最佳学习范例

遇到这一篇文档之前没有碰到过能把“隐马尔科夫模型”讲的这么清晰透彻的,HMM学习最佳范例做到了

2013-11-18

集体智慧编程(源代码)

集体智慧编程书中所有章节的源代码,请注意代码为Python编写!

2013-11-03

新浪微博数据集

一个新浪新浪微博内容数据集的压缩包,进行数据挖掘分析只用。

2013-10-30

自学Matlab必备的60个程序代码

matlab自学必备利器,这些源代码看懂用自己实践一遍之后,以后上手其他的就容易多了!

2012-10-28

matlab在矩阵中的应用

matlab最强大的地方就是对矩阵的运算能力强,课件对这一强大基本的功能做了基础的介绍!

2012-10-28

matlab基础课件

对matlab的使用做了一些基础性的介绍,看完之后基本上算是入门了!

2012-10-28

《MATLAB程序设计教程》源代码

对matlab的使用做了一下入门性的介绍,并包含大部分常用的源代码!

2012-10-28

visio 2007指南

这是微软发布的官方visio指南,清新简洁,pdf的,一共37页,几个小时就能把visio搞的差不多。

2012-08-23

visio教程(pdf版)

visio教程,完整清新pdf版呈上,基本上可以在短时间内快速掌握visio基本技能!

2012-08-23

现代无线通信

西蒙 赫金的现代无线通信的中文版,经典程度就不解释了

2012-08-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除