java
文章平均质量分 83
小草君
其实,你不快乐的根源,是因为你不知道要什么!你不知道要什么,所以你不知道去追求什么,你不知道追求什么,所以你什么也得不到
展开
-
java内存回收
java垃圾回收机制,内存泄露 ,内存分配原创 2015-01-06 22:28:16 · 690 阅读 · 0 评论 -
深度解析 Twitter Heron 大数据实时分析系统
深度解析 Twitter Heron 大数据实时分析系统翻译 2016-07-12 18:14:27 · 3070 阅读 · 0 评论 -
mapreduce 案例解析
mapreduce 求各个部门的人数和平均工资 案例解析 http://www.tongtongxue.com/archives/2972.html原创 2016-07-03 18:29:52 · 958 阅读 · 0 评论 -
Java8 Lambda
Java8 Lambda转载 2016-07-03 20:34:36 · 442 阅读 · 0 评论 -
Storm架构分析
Storm架构分析 Storm架构分析转载 2016-06-18 22:45:26 · 956 阅读 · 0 评论 -
eclipse构建maven scala 项目 编译成功
eclipse构建maven+scala+spark工程 eclipse构建maven scala 项目 编译成功原创 2016-07-05 13:28:36 · 14126 阅读 · 1 评论 -
Hadoop中Partition解析 和 storm的grouping
解析PartitionMap的结果,会通过partition分发到Reducer上,Reducer做完Reduce操作后,通过OutputFormat,进行输出,下面我们就来分析参与这个过程的类。Mapper的结果,可能送到Combiner做合并,Combiner在系统中并没有自己的基类,而是用Reducer作为Combiner的基类,他们对外的功能是一样的,只是使用的位置和使用时原创 2016-06-19 14:23:03 · 961 阅读 · 0 评论 -
Spark 应用程序调优
Spark 应用程序调优转载 2016-07-06 20:14:04 · 2660 阅读 · 0 评论 -
Apache Spark Jobs 性能调优
Apache Spark Jobs 性能调优转载 2016-07-06 20:15:34 · 1976 阅读 · 0 评论 -
《java虚拟机》汇总所有关键要点
《java虚拟机》汇总所有知识点原创 2016-07-17 14:05:13 · 2010 阅读 · 0 评论 -
scala spark hbase 操作案例
scala spark hbase 操作案例原创 2016-07-08 13:46:22 · 6856 阅读 · 0 评论 -
深入HBase架构解析
深入HBase架构解析深入HBase架构解析深入HBase架构解析深入HBase架构解析转载 2016-06-12 20:36:57 · 8234 阅读 · 0 评论 -
Maven类包冲突终极解决
Maven类包冲突终极解决转载 2016-07-08 14:38:37 · 8000 阅读 · 0 评论 -
Mahout推荐开发总结
Mahout推荐算法API详解转载 2016-07-09 09:38:34 · 2288 阅读 · 0 评论 -
数据库检索 索引之--- B 树
B树索引是一个典型的树结构,始终是平衡的,也就是说 从Root节点到 Leaf 节点的任何一个路径都是等距离的。其包含的组件主要是: 叶子节点(Leaf node):包含条目直接指向表里的数据行。 分支节点(Branch node):包含的条目指向索引里其他的分支节点或者是叶子节点。 根节点(Branch node)原创 2016-07-22 10:42:06 · 4965 阅读 · 0 评论 -
Java 并发工具包 java.util.concurrent 用户指南
译序本指南根据 Jakob Jenkov 最新博客翻译,请随时关注博客更新:http://tutorials.jenkov.com/java-util-concurrent/index.html。本指南已做成中英文对照阅读版的 pdf 文档,有兴趣的朋友可以去 Java并发工具包java.util.concurrent用户指南中英文对照阅读版.pdf[带书签] 进行下载。转载 2016-08-24 22:58:31 · 750 阅读 · 1 评论 -
ZooKeeper原理及使用
ZooKeeper原理及使用转载 2016-06-15 10:10:22 · 743 阅读 · 0 评论 -
HBase -ROOT-和.META.表结构
HBase -ROOT-和.META.表结构转载 2016-06-14 20:10:01 · 4116 阅读 · 1 评论 -
三届(2012、2011、2009)KDD Cup内容、数据源和论文
根据腾讯微博中的用户属性(User Profile)、SNS社交关系、在社交网络中的互动记录(retweet、comment、at)等,以及过去30天内的历史item推荐记录,来预测接下来最有可能被用户接受的推荐item列表原创 2016-07-11 13:48:12 · 2783 阅读 · 1 评论 -
java虚拟机VM运行时数据区域
看到了一篇好文章,和大家分享一下。java 在VM运行时数据存储的区域JVM执行Java程序的过程中,会使用到各种数据区域,这些区域有各自的用途、创建和销毁时间。根据《Java虚拟机规范(第二版)》(下文称VM Spec)的规定,JVM包括下列几个运行时数据区域:1.程序计数器(Program Counter Register):每一个Java线程都有一个程序计数器来用于保转载 2015-01-07 00:03:02 · 782 阅读 · 0 评论 -
Java开发中的23种设计模式详解(转)
设计模式(Design Patterns) ——可复用面向对象软件的基础设计模式(Design pattern)是一套被反复使用、多数人知晓的、经过分类编目的、代码设计经验的总结。使用设计模式是为了可重用代码、让代码更容易被他人理解、保证代码可靠性。 毫无疑问,设计模式于己于他人于系统都是多赢的,设计模式使代码编制真转载 2015-01-07 21:30:36 · 656 阅读 · 0 评论 -
java对redis的基本操作
一、server端安装 1、下载 https://github.com/MSOpenTech/redis 可看到当前可下载版本:redis2.6 下载windows平台文件: 解压后,选择当前64位win7系统对应的版本: 2、安装 1)解转载 2015-03-21 17:34:26 · 1483 阅读 · 0 评论 -
hive优化之------控制hive任务中的map数和reduce数
一、 控制hive任务中的map数: 1. 通常情况下,作业会通过input的目录产生一个或者多个map任务。 主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到,该参数不能自定义修改);2. 举例: a) 假设input目录下有原创 2015-03-22 22:26:22 · 559 阅读 · 0 评论 -
hive大数据倾斜总结
关键词情形后果Join其中一个表较小,但是key集中分发到某一个或几个Reduce上的数据远高于平均值大表与大表,但是分桶的判断字段0值或空值过多这些空值都由一个reduce处理,灰常慢group bygroup by 维度过小,某值的数量过多处理转载 2015-03-22 22:46:15 · 2046 阅读 · 0 评论 -
管理系统的权域设计
管理系统的权域设计原创 2016-03-27 16:53:34 · 962 阅读 · 1 评论 -
hadoop 多表关联
hadoop mapreduce实现表关联,笛卡尔集。 hadoop 多表关联转载 2016-05-26 13:11:20 · 2465 阅读 · 0 评论 -
Spark RDD详解
RDD:Spark的核心概念是RDD (resilientdistributed dataset),指的是一个只读的,可分区的分布式数据集,这个数据集的全部或部分可以缓存在内存中,在多次计算间重用。转载 2016-05-07 18:23:21 · 2493 阅读 · 0 评论 -
Flume+kafka+spark streaming+scala(sbt编译) 例子演示
Flume+kafka+spark streaming+scala(sbt编译) 例子演示 原创。原创 2016-05-18 14:20:34 · 3073 阅读 · 3 评论 -
Flume 数据采集系统 性能优化和关键问题汇总
Flume 性能优化 和关键问题汇总 Flume 数据采集系统 性能优化和关键问题汇总 Flume 数据采集系统 性能优化和关键问题汇总原创 2016-06-01 20:02:56 · 13415 阅读 · 0 评论 -
使用scala实现pageRank算法
使用scala实现pageEank算法原创 2016-06-02 19:13:40 · 1745 阅读 · 0 评论 -
使用scala实现pageRank算法
使用scala实现pageRank算法 使用scala实现pageRank算法 使用scala实现pageRank算法 使用scala实现pageRank算法原创 2016-06-02 19:38:31 · 3020 阅读 · 0 评论 -
搭建hadoop2.6.0 HA及YARN HA
搭建hadoop2.6.0 HA及YARN HA转载 2016-06-06 18:01:53 · 670 阅读 · 0 评论 -
关联规则数据挖掘算法
关联规则数据挖掘算法原创 2016-07-10 13:16:37 · 870 阅读 · 0 评论 -
Solr查询详解
这节重点是讲Solr的查询相关的知识点一、 查询参数说明 在做solr查询的时候,solr提供了很多参数来扩展它自身的强大功能!以下是使用频率最高的一些参数! 1、常用 q - 查询字符串,这个是必须的。如果查询所有*:* ,根据指定字段查询(Name:张三 AND Address:北京)fq - (filter query)过虑查询,原创 2016-10-17 10:52:10 · 7848 阅读 · 1 评论