草藤木屋-CSDN博客

原创 java 堆栈

java 栈：指令（程序），类方法的本地变量、实例的引用地址java 堆：类实例成员属性堆内存中存放的是new出的对象，new出的对象只包含成员变量。栈内存中：存放的是局部成员变量。对于基本的数据类型存放的是基本变量的值，而对于对象变量，存放的是堆内存的地址。静态、常量区：存放的是静态变量(类变量)或是常量。方法区：存放的是对象的方法。因此即使new出多个对象

2015-10-09 17:29:44 437

转载深入理解java嵌套类和内部类

一、什么是嵌套类及内部类　　可以在一个类的内部定义另一个类，这种类称为嵌套类（nested classes），它有两种类型：静态嵌套类和非静态嵌套类。静态嵌套类使用很少，最重要的是非静态嵌套类，也即是被称作为内部类（inner）。嵌套类从JDK1.1开始引入。其中inner类又可分为三种：　　其一、在一个类（外部类）中直接定义的内部类；　　其二、在一个方法（外部类的方法

2015-10-09 16:58:05 541

原创交易事实表、周期快照事实表和累积快照事实表

交易事实表、周期快照事实表和累积快照事实表

2014-10-13 09:41:58 8242

转载星型模型和雪花型模型

一、概述在多维分析的商业智能解决方案中，根据事实表和维度表的关系，又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候，就应考虑数据是按照星型模型还是雪花型模型进行组织。当所有维表都直接连接到“ 事实表”上时，整个图解就像星星一样，故将该模型称为星型模型，如图 1 。星型架构是一种非正规化的结构，多维数据集的每一个维度都直接与事实表相连接，不存在渐变维度，

2014-10-11 17:13:19 748

原创数据仓库的构件

数据仓库的构件

2014-10-10 21:48:25 947

原创数据仓库的设计目的

数据仓库的设计目的

2014-10-10 21:10:06 3744

原创 Hadoop Map/Reduce 原理

Hadoop是Apache 下的一个项目，由HDFS、MapReduce、HBase、Hive 和ZooKeeper等成员组成。其中，HDFS 和MapReduce 是两个最基础最重要的成员。HDFS是Google GFS 的开源版本，一个高度容错的分布式文件系统，它能够提供高吞吐量的数据访问，适合存储海量（PB 级）的大文件（通常超过64M），其原理如下图所示：

2014-09-24 14:18:52 1035

原创高聚合低耦合

高聚合与低耦合，思想用在建设企业数据仓库上

2014-08-25 10:17:11 1414

转载 SPU、SKU、ARPU

首先，搞清楚商品与单品的区别。例如，iphone是一个单品，但是在淘宝上当很多商家同时出售这个产品的时候，iphone就是一个商品了。商品：淘宝叫item，京东叫product，商品特指与商家有关的商品，每个商品有一个商家编码，每个商品下面有多个颜色，款式，可以有多个SKU。SPU = Standard Product Unit （标准化产品单元）SPU是商品信

2014-08-19 14:59:52 751

原创互联网术语

信息烟囱

2014-08-15 17:49:46 722

转载 PV、UV、IP的区别

PV、UV、IP的区别网站推广首先需要一个统计工具，从目前来看，常用的统计工具有：51la,量子恒道统计等。它们常用的衡量标准为PV、UV、IP。那么什么是PV、UV和IP呢？--------首先来看看ip、uv和pv的定义----------PV(访问量)：即Page View, 即页面浏览量或点击量，用户每次刷新即被计算一次。 UV(独立访客)：即U

2014-08-15 15:27:21 699

原创有用的链接

http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842821.html

2014-07-31 21:17:02 469

原创 Shell 命令行快捷键

Shell 命令行快捷键

2014-07-03 14:42:03 955

转载产品经理 MRD PRD BRD

产品经理必备的BRD、PRD、MRD的文档，很多公司这三个文档区分则很模糊，甚至有时候三个文档写到一个文档中，细分出好多的支，OK！一个文档满足了所有与产品相关的人，包括商务、运营、市场、开发、测试等，结果呢？很多人文档看不懂，甚至提出一大堆的问题！今天想聊的是这三个文档我的简单理解方法！先说说这三个文档怎么好记，听过有些人容易记混，把单词给整理了出来，这样就不会乱！BRD 商业需

2014-07-03 11:26:47 2673

原创 Spark on Yarn部署

Spark 1.0.0 on Yarn 集群部署

2014-07-02 18:14:05 1406

原创 Hadoop Yarn 安装

为了构建基于Yarn体系的Spark集群，先要安装Hadoop集群，为了以后查阅方便记录了我本次安装的具体步骤。

2014-06-30 16:48:06 4670 1

原创 Spark 读取HDFS文件

scala> val distFile = sc.textFile("hdfs://localhost:54310/data/in/log")

2014-06-19 18:00:05 5532 1

原创 Hive 优化总结

1. left semi join let semi join 只是hive的一种join。

2014-06-17 11:20:51 669

原创 sbt 构建scala 项目

sbt 构建scala 项目

2014-06-16 12:54:41 2246

原创 Scala 单例对象

单例对象：类是指用class定义的scala 对象，如果用object替换class关键字，那么这个就叫单例对象，sigleton object。很难理解，下面使用三种使用校验和的方式来解释大家的疑问。

2014-06-07 15:58:34 1464

原创 Scala 类认识

Scala 类认识

2014-06-07 12:33:50 973

转载 Hadoop多文件输出：MultipleOutputFormat和MultipleOutputs深究

由于本文比较长，考虑到篇幅问题，所以将本文拆分为二，请阅读本文之前先阅读本文的第一部分《Hadoop多文件输出：MultipleOutputFormat和MultipleOutputs深究(一)》。为你带来的不变，敬请谅解。　　与MultipleOutputFormat类不一样的是，MultipleOutputs可以为不同的输出产生不同类型，到这里所说的MultipleOutputs类还是旧版

2014-06-06 15:37:45 812

原创 Scala 读文件

Scala 读文件操作

2014-05-24 15:38:48 1413

原创 Scala-LIST/Tuple/Map

Scala-LIST/Tuple/Map

2014-05-24 09:15:51 1418

原创 Scala 数组-Array

Scala 数组-Array

2014-05-23 17:46:16 1660

原创 Scala 循环

Scala 循环

2014-05-23 17:07:24 2818 1

原创 Scala 脚本

Scala脚本

2014-05-23 11:25:42 991

原创 Scala 函数

scala> def max(x: Int,y: Int): Int

2014-05-22 17:59:08 781

转载 Jenkins + Maven + Git 安装

Linux/Windows上Jenkins + Maven + Git的安装第一部分：认识JenkinsJenkins是一个开源软件项目，旨在提供一个开放易用的软件平台，使持续集成变成可能。Jenkins，之前叫做Hudson，是基于Java开发的一种持续集成工具，用于监控秩序重复的工作，包括：1、持续的软件版本发布/测试项目。2、监控外部调

2014-05-16 15:12:01 1239

原创 Hadoop 2.0 Queue

Hadoop 2.0 Queue setting 解析

2014-05-13 10:08:55 3141 1

原创 Git 使用笔记

Git 使用笔记

2014-05-12 20:20:00 1198

原创 Oracle 术语

1. 比较符两边类型一致

2014-05-10 17:25:09 769

转载 Oracle SQL优化总结

之前的blog中零零散散的整理了一些优化相关的内容，找起来比较麻烦，所以总结一下，查看的时候方便一点。这篇BLog只看SQL 优化的相关的注意事项，数据库优化部分以后有空在整理。SQL 的优化主要涉及几个方面：（1）相关的统计信息缺失或者不准确（2）索引问题（3） SQL 的本身的效率问题，比如使用绑定变量，批量DML 采用bulk等，这个就考验写SQL的基本功了，这一点也

2014-05-10 16:49:57 695

原创 Linux Shell 常用指令示例

Shell 常用指令示例

2014-05-10 00:49:08 530

原创 Linux Sed 使用示例

环境：CentOS鉴于语句描述苍白无力，用例子直接说明。mytxt文件内容：zilzhang 19881110 jiangxi 18 filmzhagnsan 21321 sichuan 100 cardlisi 3435 hunan 65 TV1. 找出文件第二行$ sed -n '2p' mytxtzhagnsan

2014-05-08 22:00:36 708

原创 Linux awk 使用用例

环境：CentOS鉴于语句描述苍白无力，用例子直接说明

2014-05-08 18:36:32 1127

原创 Linux grep 使用示例

环境：CentOS 6.3

2014-05-08 16:38:09 508

原创 Linux find 命令使用示例

shell find 命令使用示例

2014-05-06 17:43:40 709

转载 Linux shell 文件权限相位点的含义

大家在使用RHEL6的时候，用ls -l命令查看文件的权限的时候，你可能会发现，这个权限的表示内容，已经与以前的版本不一样了，后面多了一个点，这个点是干吗的呢？搜索了很久也没有找到答案，很是郁闷啊！于是乎就只能自己慢慢研究.首先来看看我是如何找到答案的，这个也是我的思路，和大家分享一下.1、直接在网上搜索，但都找不到答案.2、怀疑会不会像域名一样，来用个点来表示结尾呢？3、怀疑

2014-05-05 22:09:55 1082

原创 Linux 文件相位

环境：CentOS 6.3[hadoop@localhost checksum]$ ls -lrttotal 1352-rwxrwxrwx. 1 hadoop hadoop 1363869 Feb 16 18:22 checksum.jar-rwxrwxrwx. 1 hadoop hadoop 345 Feb 24 18:02 config.ini~-rwxrwxrwx

2014-05-05 22:04:27 511

空空如也

空空如也