自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (1)
  • 收藏
  • 关注

转载 秒杀99%海量数据处理问题 (总结与July 博客)

何谓海量数据处理? 数据量太大,所以导致要么是无法在较短时间内迅速解决,要么是数据太大,导致无法一次性装入内存。

2014-08-11 19:09:22 920

转载 hadoop 框架中知识的一点总结

① 在处理之前,将数据集分布至各个节点(通过HDFS)。处理时,每个节点就近读取本地存储的数据处理(map),将处理后的数据进行合并(combine)、排序(shuffle and sort)后再分发(至reduce节点),避免了大量数据的传输,提高了处理效率。无共享式架构的

2014-08-09 20:21:50 447

原创 快速排序

快速排序 快速排序算法是基于分治策略的一个排序算法,其基本思想是,对于输入的子数组,按以下三个步骤求解: 1 分解:选择一个基准元素,将整个数组分为大于基准元素,等于基准元素,小于基准元素的三组。基准元素在在划分的过程中确定 2  递归求解:通过递归调用快速排序算法分别对大于和小于基准元素的数组进行排序 3  合并:将递归的子数组进行合并最后成为排好序的数组 下面是程序的代码: #in

2014-07-12 19:38:18 467

原创 hadoop学习笔记1(Hadoop的源起与体系介绍)

1,什么是大数据? 首先ta

2014-07-10 18:36:46 416

转载 对《从决策树学习谈到贝叶斯分类算法、EM、HMM》的自己总结

文章参考:《从决策树学习谈到贝叶斯分类算法、EM、HMM》

2014-07-09 09:58:22 909

原创 自己总结的算法导论考试用的算法

Dijkstra算法:  循环n-1次:  1. 在没有扩展过的点中取一距离最小的点u,并将其状态设为已扩展。 2. 对于每个与u相邻的点v,如果dist[u] + w[u,v] ,那么把dist[v]更新成更短的距离dist[u] + w[u,v]。此时到点v的最短路径上,前一个节点即为u。  结束:此时对于任意的u,dist[u]就是s到u的距离。   每次加入一个点的时候,都要判断

2014-07-07 11:39:12 1168

自己总结的算法导论考试用的算法

自己总结的算法导论考试用的算法

2014-07-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除