hadoop 入门级 实战

hadoop 实战  开头:本文介绍hadoop mapreduce开发的一般方法 默认你已经完美的装上了hadoop 并搭建好了开发环境 一、简单的代码框架 加载配置文件 /**加载配置的类 采用单例模式*/ import org.apache.hadoop.conf.Co...

2015-05-15 16:46:04

阅读数:369

评论数:0

iOS 基于 HSB hsv 颜色模型的颜色选择器的实现

在色彩领域计算机

2014-09-18 13:57:08

阅读数:525

评论数:0

五分钟精通sparksql源码-加简历

# 序言 - spark1.6之后引入DataSet,一种基于RDD的高级抽象,在RDD之上加入了scheme信息,给RDD的元素的每一列提供了名称和数据类型的标志。 - 同时DataSet还提供了更多的api,可以实现类似于sql的操作,而且在catalyst优化器的优化下我们的代码将更加高...

2018-12-14 13:39:45

阅读数:4477

评论数:3

如何从数据的角度做一个招聘平台产品

一、招聘平台的价值 首先一个招聘平台其实就是一个供需平台,HR提供需求说明(JD:职位描述)想要获取与之匹配的简历(CV),而应聘者手里握着简历想找一份匹配的JD来投递。 所以招聘平台的价值其实就是做JD和CV两种元素的匹配,所以平台的目标就是要提升JD、CV的匹配量。 二、如何提升匹配量 ...

2018-12-14 13:35:29

阅读数:36

评论数:0

三分钟分布式CAP理论就这么复杂

分布式系统架构理论,定义了三种指标,理论说我们最多只能满足两个。 ## 分布式系统 首先我们这个理论所说的分布式系统,是指系统内会共享数据,互相有连接有交互,才能完成系统功能的的分布式系统。而这个理论的关注点是**数据**的读写。   ## 三种指标 - Consistency 一致性:...

2018-12-14 13:34:02

阅读数:5725

评论数:0

大数据基础概念

传统的大数据在大数据这个概念还没出来以前人们是怎么进行数据数据分析和计算的呢? 数据存储首先数据量都没有很大,不同的数据散布在不同数据库中。如果真的数据大的话就只能花最贵的钱买最好的机器最好的数据库或者多分几个库装。 数据分析人们还没有意识到数据可以做很多事情,所以数据的需求也比较少; 使用...

2018-10-20 16:54:24

阅读数:101

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭