Soul Joy Hub

但行好事,莫问前程。

Tachyon(现名:Alluxio):Spark生态系统中的分布式内存文件系统

原文: http://www.csdn.net/article/2015-06-25/2825056 Tachyon是Spark生态系统内快速崛起的一个新项目。 本质上, Tachyon是个分布式的内存文件系统, 它在减轻Spark内存压力的同时,也赋予了Spark...

2016-11-29 16:30:18

阅读数 776

评论数 0

提高机器学习模型准确率的八大方法

想要提高模型的性能有时会是一件难度不小的事情。如果你也遇到过类似的情况,相信一定会认同我这一看法。在一一尝试毕生所学的对策和算法之后,依然没能够提高模型的准确率,这时,一种陷入困境的无助感就会涌上心头。事实上,百分之九十的数据科学家就是在这一阶段选择了放弃。但是,好戏这才开始!正是这一点划清了平凡...

2016-11-28 15:25:43

阅读数 7176

评论数 0

MapReduce Shuffle原理 与 Spark Shuffle原理

MapReduce Shuffle原理 与 Spark Shuffle原理 MapReduce的Shuffle过程介绍   Shuffle的本义是洗牌、混洗,把一组有一定规则的数据尽量转换成一组无规则的数据,越随机越好。MapReduce中的Shuffle更像是洗牌的逆过程,把一组无规则的...

2016-11-27 17:51:28

阅读数 1879

评论数 0

移动电影售票系统案例分析

智能手机及移动互联网的普及,手机购票成为网络购物常见的应用形式之一。本项目名称为:本项目名称为:XX 票务(可以是电影票、演出票…)销售系统,系统目标是实现在线票务发布,销售,验票等一站式票务服务,要求支持手机在线购票验票功能。用例图 运用StarUML/EA(Enterprise Arch...

2016-11-14 18:41:27

阅读数 3726

评论数 3

Java重要知识点(继承、多态、接口,异常,工具,测试)

继承、多态多态调用的顺序重写 hashcode equals comparetopublic class Employee{ private String name; private doub1e salary; private Date hireDay; publ...

2016-11-13 17:27:39

阅读数 769

评论数 0

hadoop io 源码阅读

序列化 我们先来看下hadoop官网上给的MapReduce统计词频的示例: import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; ...

2016-11-09 21:41:25

阅读数 863

评论数 0

Maven依赖中的scope详解

http://blog.csdn.net/kimylrong/article/details/50353161 Maven的一个哲学是惯例优于配置(Convention Over Configuration), Maven默认的依赖配置项中,scope的默认值是compile,项目...

2016-11-02 10:14:23

阅读数 723

评论数 0

JUnit中assertEquals和assertSame方法的不同

JUnit中assertEquals和assertSame方法的不同 1)提供的接口数量不完全相同。assertEquals支持boolean,long,int等等java primitiveType变量。assertS...

2016-11-01 20:17:33

阅读数 1681

评论数 0

提示
确定要删除当前文章?
取消 删除