自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

韩利鹏

大数据云计算,算法

  • 博客(10)
  • 资源 (5)
  • 问答 (1)
  • 收藏
  • 关注

原创 星形模型和雪花模型

一、概述在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。当所有维表都直接连接到" 事实表"上时,整个图解就像星星一样,故将该模型称为星型模型,如图 1 。星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一

2018-01-29 14:54:58 860

原创 自己写UDF(Hive)

目标:使用java自己写一个UDF函数1、先开发一个java类,继承UDF,并重载evaluate方法package com.udf;import org.apache.hadoop.hive.ql.exec.UDF;import org.apache.hadoop.io.Text;public final class Lower extends UDF{ public

2018-01-28 22:18:07 657

原创 hive累积报表hql

问题:下面是一个员工的业绩数据,数据格式是username,date,money,数据如下A,2015-01,5A,2015-01,15B,2015-01,5A,2015-01,8B,2015-01,25A,2015-01,5A,2015-02,4A,2015-02,6B,2015-02,10B,2015-02,5加载到hive表中了(t_access_times)。

2018-01-28 22:10:24 1134

原创 查看linux负载的情况

查看一个服务器的负载情况一般是从内存,cpu的使用量来看的,还有就是磁盘io和网络io,下面会分别对其进行监控(环境sentos6.7) 内存负载情况: free这个命令可以查看内存的使用情况可剩余情况:具体使用如图 cpu的负载情况: 使用top来动态的显示,直接在命令行中输入 top 就能显示如下图所示: load average是显示的是cpu的负载情况,三个数分别是1

2018-01-26 14:34:43 7214

原创 linux的awk和sed等命令比较

对于文本的操作分为两种操作,一种是按行操作,一种是按列操作。 简单的命令有grep(行操作)和cut(列操作)。 复杂点的有sed(行操作)和awk(列操作)。 样例文本hello tomhi marryhow are you什么是行操作:简单的例子就是,获取上面文本中带有hello的行就是行操作。 什么是列操作:简单的例子就是获取上面文本中的第一列操作。grepp

2018-01-22 15:41:45 1157

原创 jvm参数说明

GC算法标记-清除算法(Mark-Sweep)1、标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象2、在标记完成后统一回收所有被标记的对象缺点:一个是效率问题,标记和清除两个过程的效率都不高;另一个是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾

2018-01-21 22:22:03 384

转载 Hbase索引

Hbase只有rowkey有索引,其索引形式是LSM.讲LSM树之前,需要提下三种基本的存储引擎,这样才能清楚LSM树的由来:哈希存储引擎 是哈希表的持久化实现,支持增、删、改以及随机读取操作,但不支持顺序扫描,对应的存储系统为key-value存储系统。对于key-value的插入以及查询,哈希表的复杂度都是O(1),明显比树的操作O(n)快,如果不需要有序的遍历数据,哈希表就是yo

2018-01-18 14:38:08 1918

原创 redis-shell操作

zset没有进行说明package javaa.redis;/** * redis的shell操作 * redis的五种类型:String hash set list zset * @author 韩利鹏 * */public class RedisShell { //flushDB清空数据 /** * String操作: * set name han

2018-01-02 14:56:40 1597

原创 redis集群操作-添加节点和删除节点

主要任务:为已有的集群添加节点,其中包括master和slave,master主要给其分槽,删除节点,其中包括master和slave节点,master需要先把数据槽先归还,然后再删除节点。一、原始集群(6节点 3主3从): (1)启动集群:[root@bhz004 ~]# /usr/local/redis/bin/redis-server /usr/local/redis-cluster/700

2018-01-02 14:51:48 3322

原创 redis跟spring结合

主要是以下配置文件,里面需要添加的redis.properties等这些文件,根据配置自己添加<?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance

2018-01-02 14:25:00 324

mongodb-Linux版本

linux平台的mongodb版本是3.2.18.tgz,可以直接解压使用,想不要资源分的,但是选择不了,尴尬

2017-12-04

scala源码-2.11.x.zip

scala源码2.11.x,是学习scala,查看源码的必备东西,拿走不谢,本来是不要分的,可是不能不选,就少选点吧。

2017-11-03

SQLyog Enterprise_jb51.net.zip

能够对对数据库进行可视化的操作,内涵破解工具,简单好用

2016-10-12

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除