自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(51)
  • 收藏
  • 关注

原创 java 堆栈

java 栈: 指令(程序),类方法的本地变量、实例的引用地址java 堆: 类实例成员属性堆内存中存放的是new出的对象,new出的对象只包含成员变量。 栈内存中:存放的是局部成员变量。对于基本的数据类型存放的是基本变量的值,而对于对象变量,存放的是堆内存的地址。 静态、常量区:存放的是静态变量(类变量)或是常量。 方法区:存放的是对象的方法。因此即使new出多个对象

2015-10-09 17:29:44 437

转载 深入理解java嵌套类和内部类

一、什么是嵌套类及内部类  可以在一个类的内部定义另一个类,这种类称为嵌套类(nested classes),它有两种类型:静态嵌套类和非静态嵌套类。静态嵌套类使用很少,最重要的是非静态嵌套类,也即是被称作为内部类(inner)。嵌套类从JDK1.1开始引入。其中inner类又可分为三种:  其一、在一个类(外部类)中直接定义的内部类;  其二、在一个方法(外部类的方法

2015-10-09 16:58:05 541

原创 交易事实表、周期快照事实表和累积快照事实表

交易事实表、周期快照事实表和累积快照事实表

2014-10-13 09:41:58 8242

转载 星型模型和雪花型模型

一、概述在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。当所有维表都直接连接到“ 事实表”上时,整个图解就像星星一样,故将该模型称为星型模型,如图 1 。星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,

2014-10-11 17:13:19 748

原创 数据仓库的构件

数据仓库的构件

2014-10-10 21:48:25 947

原创 数据仓库的设计目的

数据仓库的设计目的

2014-10-10 21:10:06 3744

原创 Hadoop Map/Reduce 原理

Hadoop是Apache 下的一个项目,由HDFS、MapReduce、HBase、Hive 和ZooKeeper等成员组成。其中,HDFS 和MapReduce 是两个最基础最重要的成员。HDFS是Google GFS 的开源版本,一个高度容错的分布式文件系统,它能够提供高吞吐量的数据访问,适合存储海量(PB 级)的大文件(通常超过64M),其原理如下图所示:

2014-09-24 14:18:52 1035

原创 高聚合 低耦合

高聚合与低耦合,思想用在建设企业数据仓库上

2014-08-25 10:17:11 1414

转载 SPU、SKU、ARPU

首先,搞清楚商品与单品的区别。例如,iphone是一个单品,但是在淘宝上当很多商家同时出售这个产品的时候,iphone就是一个商品了。商品:淘宝叫item,京东叫product,商品特指与商家有关的商品,每个商品有一个商家编码,每个商品下面有多个颜色,款式,可以有多个SKU。SPU = Standard Product Unit (标准化产品单元)SPU是商品信

2014-08-19 14:59:52 751

原创 互联网术语

信息烟囱

2014-08-15 17:49:46 722

转载 PV、UV、IP的区别

PV、UV、IP的区别网站推广首先需要一个统计工具,从目前来看,常用的统计工具有:51la,量子恒道统计等。它们常用的衡量标准为PV、UV、IP。那么什么是PV、UV和IP呢?--------首先来看看ip、uv和pv的定义----------PV(访问量):即Page View, 即页面浏览量或点击量,用户每次刷新即被计算一次。 UV(独立访客):即U

2014-08-15 15:27:21 699

原创 有用的链接

http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842821.html

2014-07-31 21:17:02 469

原创 Shell 命令行快捷键

Shell 命令行快捷键

2014-07-03 14:42:03 955

转载 产品经理 MRD PRD BRD

产品经理必备的BRD、PRD、MRD的文档,很多公司这三个文档区分则很模糊,甚至有时候三个文档写到一个文档中,细分出好多的支,OK!一个文档满足了所有与产品相关的人,包括商务、运营、市场、开发、测试等,结果呢?很多人文档看不懂,甚至提出一大堆的问题!今天想聊的是这三个文档我的简单理解方法!先说说这三个文档怎么好记,听过有些人容易记混,把单词给整理了出来,这样就不会乱!BRD 商业需

2014-07-03 11:26:47 2673

原创 Spark on Yarn部署

Spark 1.0.0 on Yarn 集群部署

2014-07-02 18:14:05 1406

原创 Hadoop Yarn 安装

为了构建基于Yarn体系的Spark集群,先要安装Hadoop集群,为了以后查阅方便记录了我本次安装的具体步骤。

2014-06-30 16:48:06 4670 1

原创 Spark 读取HDFS文件

scala> val distFile = sc.textFile("hdfs://localhost:54310/data/in/log")

2014-06-19 18:00:05 5532 1

原创 Hive 优化总结

1. left semi join    let semi join 只是hive的一种join。

2014-06-17 11:20:51 669

原创 sbt 构建scala 项目

sbt 构建scala 项目

2014-06-16 12:54:41 2246

原创 Scala 单例对象

单例对象:类是指用class定义的scala 对象, 如果用object替换class关键字, 那么这个就叫单例对象,sigleton object。 很难理解,下面使用三种使用校验和的方式来解释大家的疑问。

2014-06-07 15:58:34 1464

原创 Scala 类认识

Scala 类认识

2014-06-07 12:33:50 973

转载 Hadoop多文件输出:MultipleOutputFormat和MultipleOutputs深究

由于本文比较长,考虑到篇幅问题,所以将本文拆分为二,请阅读本文之前先阅读本文的第一部分《Hadoop多文件输出:MultipleOutputFormat和MultipleOutputs深究(一)》。为你带来的不变,敬请谅解。  与MultipleOutputFormat类不一样的是,MultipleOutputs可以为不同的输出产生不同类型,到这里所说的MultipleOutputs类还是旧版

2014-06-06 15:37:45 812

原创 Scala 读文件

Scala 读文件操作

2014-05-24 15:38:48 1413

原创 Scala-LIST/Tuple/Map

Scala-LIST/Tuple/Map

2014-05-24 09:15:51 1418

原创 Scala 数组-Array

Scala 数组-Array

2014-05-23 17:46:16 1660

原创 Scala 循环

Scala 循环

2014-05-23 17:07:24 2818 1

原创 Scala 脚本

Scala脚本

2014-05-23 11:25:42 991

原创 Scala 函数

scala> def max(x: Int,y: Int): Int

2014-05-22 17:59:08 781

转载 Jenkins + Maven + Git 安装

Linux/Windows上Jenkins + Maven + Git的安装第一部分:认识JenkinsJenkins是一个开源软件项目,旨在提供一个开放易用的软件平台,使持续集成变成可能。Jenkins,之前叫做Hudson,是基于Java开发的一种持续集成工具,用于监控秩序重复的工作,包括:1、持续的软件版本发布/测试项目。2、监控外部调

2014-05-16 15:12:01 1239

原创 Hadoop 2.0 Queue

Hadoop 2.0 Queue setting 解析

2014-05-13 10:08:55 3141 1

原创 Git 使用笔记

Git 使用笔记

2014-05-12 20:20:00 1198

原创 Oracle 术语

1. 比较符两边类型一致

2014-05-10 17:25:09 769

转载 Oracle SQL优化 总结

之前的blog中零零散散的整理了一些优化相关的内容,找起来比较麻烦,所以总结一下,查看的时候方便一点。这篇BLog只看SQL 优化的相关的注意事项,数据库优化部分以后有空在整理。SQL 的优化主要涉及几个方面:(1) 相关的统计信息缺失或者不准确(2) 索引问题(3) SQL 的本身的效率问题,比如使用绑定变量,批量DML 采用bulk等,这个就考验写SQL的基本功了,这一点也

2014-05-10 16:49:57 695

原创 Linux Shell 常用指令示例

Shell 常用指令示例

2014-05-10 00:49:08 530

原创 Linux Sed 使用示例

环境:CentOS鉴于语句描述苍白无力,用例子直接说明。mytxt文件内容:zilzhang 19881110 jiangxi 18 filmzhagnsan 21321    sichuan 100 cardlisi     3435     hunan   65  TV1. 找出文件第二行$ sed -n '2p' mytxtzhagnsan

2014-05-08 22:00:36 708

原创 Linux awk 使用用例

环境:CentOS鉴于语句描述苍白无力,用例子直接说明

2014-05-08 18:36:32 1127

原创 Linux grep 使用示例

环境:CentOS 6.3

2014-05-08 16:38:09 508

原创 Linux find 命令使用示例

shell find 命令使用示例

2014-05-06 17:43:40 709

转载 Linux shell 文件权限相位点的含义

大家在使用RHEL6的时候,用ls -l命令查看文件的权限的时候,你可能会发现,这个权限的表示内容,已经与以前的版本不一样了,后面多了一个点,这个点是干吗的呢?搜索了很久也没有找到答案,很是郁闷啊!于是乎就只能自己慢慢研究.首先来看看我是如何找到答案的,这个也是我的思路,和大家分享一下.1、直接在网上搜索,但都找不到答案.2、怀疑会不会像域名一样,来用个点来表示结尾呢?3、怀疑

2014-05-05 22:09:55 1082

原创 Linux 文件相位

环境:CentOS 6.3[hadoop@localhost checksum]$ ls -lrttotal 1352-rwxrwxrwx. 1 hadoop hadoop 1363869 Feb 16 18:22 checksum.jar-rwxrwxrwx. 1 hadoop hadoop     345 Feb 24 18:02 config.ini~-rwxrwxrwx

2014-05-05 22:04:27 511

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除