- 博客(51)
- 收藏
- 关注
原创 java 堆栈
java 栈: 指令(程序),类方法的本地变量、实例的引用地址java 堆: 类实例成员属性堆内存中存放的是new出的对象,new出的对象只包含成员变量。 栈内存中:存放的是局部成员变量。对于基本的数据类型存放的是基本变量的值,而对于对象变量,存放的是堆内存的地址。 静态、常量区:存放的是静态变量(类变量)或是常量。 方法区:存放的是对象的方法。因此即使new出多个对象
2015-10-09 17:29:44 437
转载 深入理解java嵌套类和内部类
一、什么是嵌套类及内部类 可以在一个类的内部定义另一个类,这种类称为嵌套类(nested classes),它有两种类型:静态嵌套类和非静态嵌套类。静态嵌套类使用很少,最重要的是非静态嵌套类,也即是被称作为内部类(inner)。嵌套类从JDK1.1开始引入。其中inner类又可分为三种: 其一、在一个类(外部类)中直接定义的内部类; 其二、在一个方法(外部类的方法
2015-10-09 16:58:05 541
转载 星型模型和雪花型模型
一、概述在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。当所有维表都直接连接到“ 事实表”上时,整个图解就像星星一样,故将该模型称为星型模型,如图 1 。星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,
2014-10-11 17:13:19 748
原创 Hadoop Map/Reduce 原理
Hadoop是Apache 下的一个项目,由HDFS、MapReduce、HBase、Hive 和ZooKeeper等成员组成。其中,HDFS 和MapReduce 是两个最基础最重要的成员。HDFS是Google GFS 的开源版本,一个高度容错的分布式文件系统,它能够提供高吞吐量的数据访问,适合存储海量(PB 级)的大文件(通常超过64M),其原理如下图所示:
2014-09-24 14:18:52 1035
转载 SPU、SKU、ARPU
首先,搞清楚商品与单品的区别。例如,iphone是一个单品,但是在淘宝上当很多商家同时出售这个产品的时候,iphone就是一个商品了。商品:淘宝叫item,京东叫product,商品特指与商家有关的商品,每个商品有一个商家编码,每个商品下面有多个颜色,款式,可以有多个SKU。SPU = Standard Product Unit (标准化产品单元)SPU是商品信
2014-08-19 14:59:52 751
转载 PV、UV、IP的区别
PV、UV、IP的区别网站推广首先需要一个统计工具,从目前来看,常用的统计工具有:51la,量子恒道统计等。它们常用的衡量标准为PV、UV、IP。那么什么是PV、UV和IP呢?--------首先来看看ip、uv和pv的定义----------PV(访问量):即Page View, 即页面浏览量或点击量,用户每次刷新即被计算一次。 UV(独立访客):即U
2014-08-15 15:27:21 699
转载 产品经理 MRD PRD BRD
产品经理必备的BRD、PRD、MRD的文档,很多公司这三个文档区分则很模糊,甚至有时候三个文档写到一个文档中,细分出好多的支,OK!一个文档满足了所有与产品相关的人,包括商务、运营、市场、开发、测试等,结果呢?很多人文档看不懂,甚至提出一大堆的问题!今天想聊的是这三个文档我的简单理解方法!先说说这三个文档怎么好记,听过有些人容易记混,把单词给整理了出来,这样就不会乱!BRD 商业需
2014-07-03 11:26:47 2673
原创 Hadoop Yarn 安装
为了构建基于Yarn体系的Spark集群,先要安装Hadoop集群,为了以后查阅方便记录了我本次安装的具体步骤。
2014-06-30 16:48:06 4670 1
原创 Spark 读取HDFS文件
scala> val distFile = sc.textFile("hdfs://localhost:54310/data/in/log")
2014-06-19 18:00:05 5532 1
原创 Scala 单例对象
单例对象:类是指用class定义的scala 对象, 如果用object替换class关键字, 那么这个就叫单例对象,sigleton object。 很难理解,下面使用三种使用校验和的方式来解释大家的疑问。
2014-06-07 15:58:34 1464
转载 Hadoop多文件输出:MultipleOutputFormat和MultipleOutputs深究
由于本文比较长,考虑到篇幅问题,所以将本文拆分为二,请阅读本文之前先阅读本文的第一部分《Hadoop多文件输出:MultipleOutputFormat和MultipleOutputs深究(一)》。为你带来的不变,敬请谅解。 与MultipleOutputFormat类不一样的是,MultipleOutputs可以为不同的输出产生不同类型,到这里所说的MultipleOutputs类还是旧版
2014-06-06 15:37:45 812
转载 Jenkins + Maven + Git 安装
Linux/Windows上Jenkins + Maven + Git的安装第一部分:认识JenkinsJenkins是一个开源软件项目,旨在提供一个开放易用的软件平台,使持续集成变成可能。Jenkins,之前叫做Hudson,是基于Java开发的一种持续集成工具,用于监控秩序重复的工作,包括:1、持续的软件版本发布/测试项目。2、监控外部调
2014-05-16 15:12:01 1239
转载 Oracle SQL优化 总结
之前的blog中零零散散的整理了一些优化相关的内容,找起来比较麻烦,所以总结一下,查看的时候方便一点。这篇BLog只看SQL 优化的相关的注意事项,数据库优化部分以后有空在整理。SQL 的优化主要涉及几个方面:(1) 相关的统计信息缺失或者不准确(2) 索引问题(3) SQL 的本身的效率问题,比如使用绑定变量,批量DML 采用bulk等,这个就考验写SQL的基本功了,这一点也
2014-05-10 16:49:57 695
原创 Linux Sed 使用示例
环境:CentOS鉴于语句描述苍白无力,用例子直接说明。mytxt文件内容:zilzhang 19881110 jiangxi 18 filmzhagnsan 21321 sichuan 100 cardlisi 3435 hunan 65 TV1. 找出文件第二行$ sed -n '2p' mytxtzhagnsan
2014-05-08 22:00:36 708
转载 Linux shell 文件权限相位点的含义
大家在使用RHEL6的时候,用ls -l命令查看文件的权限的时候,你可能会发现,这个权限的表示内容,已经与以前的版本不一样了,后面多了一个点,这个点是干吗的呢?搜索了很久也没有找到答案,很是郁闷啊!于是乎就只能自己慢慢研究.首先来看看我是如何找到答案的,这个也是我的思路,和大家分享一下.1、直接在网上搜索,但都找不到答案.2、怀疑会不会像域名一样,来用个点来表示结尾呢?3、怀疑
2014-05-05 22:09:55 1082
原创 Linux 文件相位
环境:CentOS 6.3[hadoop@localhost checksum]$ ls -lrttotal 1352-rwxrwxrwx. 1 hadoop hadoop 1363869 Feb 16 18:22 checksum.jar-rwxrwxrwx. 1 hadoop hadoop 345 Feb 24 18:02 config.ini~-rwxrwxrwx
2014-05-05 22:04:27 511
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人