zailushang1708-CSDN博客

转载秒杀99%海量数据处理问题 (总结与July 博客)

何谓海量数据处理？数据量太大，所以导致要么是无法在较短时间内迅速解决，要么是数据太大，导致无法一次性装入内存。

2014-08-11 19:09:22 922

转载 hadoop 框架中知识的一点总结

① 在处理之前，将数据集分布至各个节点（通过HDFS）。处理时，每个节点就近读取本地存储的数据处理（map），将处理后的数据进行合并（combine）、排序（shuffle and sort）后再分发（至reduce节点），避免了大量数据的传输，提高了处理效率。无共享式架构的

2014-08-09 20:21:50 453

原创快速排序

快速排序快速排序算法是基于分治策略的一个排序算法，其基本思想是，对于输入的子数组，按以下三个步骤求解： 1 分解：选择一个基准元素，将整个数组分为大于基准元素，等于基准元素，小于基准元素的三组。基准元素在在划分的过程中确定 2 递归求解：通过递归调用快速排序算法分别对大于和小于基准元素的数组进行排序 3 合并：将递归的子数组进行合并最后成为排好序的数组下面是程序的代码： #in

2014-07-12 19:38:18 469

原创 hadoop学习笔记1（Hadoop的源起与体系介绍）

1，什么是大数据？首先ta

2014-07-10 18:36:46 423

转载对《从决策树学习谈到贝叶斯分类算法、EM、HMM》的自己总结

文章参考：《从决策树学习谈到贝叶斯分类算法、EM、HMM》

2014-07-09 09:58:22 914

原创自己总结的算法导论考试用的算法

Dijkstra算法: 循环n-1次： 1. 在没有扩展过的点中取一距离最小的点u，并将其状态设为已扩展。 2. 对于每个与u相邻的点v，如果dist[u] + w[u，v] ，那么把dist[v]更新成更短的距离dist[u] + w[u，v]。此时到点v的最短路径上，前一个节点即为u。结束：此时对于任意的u，dist[u]就是s到u的距离。每次加入一个点的时候，都要判断

2014-07-07 11:39:12 1172

自己总结的算法导论考试用的算法

2014-07-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

转载 秒杀99%海量数据处理问题 (总结与July 博客)