- 博客(16)
- 收藏
- 关注
转载 数据仓库分层DWD、DWB、DWS
DW :data warehouse 翻译成数据仓库DW数据分层,由下到上为 DWD,DWB,DWSDWD:data warehouse detail 细节数据层,有的也称为 ODS层,是业务层与数据仓库的隔离层DWB:data warehouse base 基础数据层,存储的是客观数据,一般用作中间层,可以认为是大量指标的数据层。DWS:data warehouse service 服务...
2018-08-29 17:11:25 48717 5
转载 Gradle打jar包如何上传到maven本地库
前言 本篇教程偏向实战,程序猿直接copy代码加入到自己的项目中做简单的修修改改便可使用,而对于Gradle以及Maven不在此进行展开介绍,如有读者希望了解可以给我留言,并持续关注,我后续会慢慢更新。(黑色区域代码部分,安卓手机可手动向左滑动,来查看全部代码) 定义Maven是一个项目管理和自动构建工具。Gradle是一个基于Apache Ant和Apache M...
2018-08-27 10:54:50 764
转载 Spring Cloud Eureka REST 接口
Eureka 作为注册中心,其本质是存储了每个客户端的注册信息,Ribbon在转发的时候会获取注册中心的服务列表,然后根据对应的路由规则来选择一个服务给Feign来进行调用。如果我们不是Spring Cloud技术选型,也想用Eureka可以吗?完全可以如果不是Spring Cloud技术栈个人推荐用zk之类的会方便些,当然用Eureka也是可以的这样的话就涉及到如何注册信息,获...
2018-08-24 15:04:55 169
转载 设置JDK的默认编码为UTF-8
首先,查看自己当前系统的默认编码:import java.io.ByteArrayOutputStream;import java.io.OutputStreamWriter;import java.nio.charset.Charset;class Test {public static void main(String[] args) {System.out.pri...
2018-08-21 14:31:52 3674
原创 CentOS设置系统时间与网络时间同步
Linux的时间分为System Clock(系统时间)和Real Time Clock (硬件时间,简称RTC)。系统时间:指当前Linux Kernel中的时间。硬件时间:主板上有电池供电的时间。查看系统时间的命令: date查看硬件时间的命令: hwclock与时间服务器上的时间同步1. 安装ntpdate工具# yum -y install ntp ntpd...
2018-08-15 09:43:05 170
转载 怎么打破双亲委派机制
Java类加载器Bootstrap ClassLoader:根类加载器,负责加载java的核心类,它不是java.lang.ClassLoader的子类,而是由JVM自身实现; Extension ClassLoader:扩展类加载器,扩展类加载器的加载路径是JDK目录下jre/lib/ext,扩展类的getParent()方法返回null,实际上扩展类加载器的父类加载器是根加载器,只是根加...
2018-08-14 20:47:26 27838 1
原创 @Scheduled注解参数介绍
@Scheduled注解可以控制方法定时执行,其中有三个参数可选择:1、fixedDelay控制方法执行的间隔时间,是以上一次方法执行完开始算起,如上一次方法执行阻塞住了,那么直到上一次执行完,并间隔给定的时间后,执行下一次。2、fixedRate是按照一定的速率执行,是从上一次方法执行开始的时间算起,如果上一次方法阻塞住了,下一次也是不会执行,但是在阻塞这段时间内累计应该执行的次数,当不...
2018-08-14 11:37:43 1552
转载 离线安装CM5和CDH5.13完全教程
关于CDH和Cloudera ManagerCDH (Cloudera’s Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建,并集成了很多补丁,可直接用于生产环境。Cloudera Manager则是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监...
2018-08-11 16:35:14 823
转载 Java操作Hbase进行建表、删表以及对数据进行增删改查,条件查询
1、搭建环境 新建JAVA项目,添加的包有: 有关Hadoop的hadoop-core-0.20.204.0.jar 有关Hbase的hbase-0.90.4.jar、hbase-0.90.4-tests.jar以及Hbase资源包中lib目录下的所有jar包 2、主要程序 Java代码 package com.wujintao.hbase.test;...
2018-08-11 15:47:35 316
转载 Twitter 全局序列ID生成算法
分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。为了满足Twitter每秒上万条消息的请求,每条消息都必须分配一条唯一的id,这些id还需要一些大致的顺序(方便客户端排序),并且在分布式系统中不同机器产生的id必须不同。 public class IdSeqGe...
2018-08-11 15:02:17 1005
转载 java操作kudu数据库
建表语句: create table user_portrait_kudu(id STRING, open_id STRING, user_id STRING,label_code STRING, label_level SMALLINT, label_name STRING, label_str_value STRING, label_num_value DOUBLE, PRIM...
2018-08-11 14:55:51 5812 2
转载 Spring容器扩展点:后置处理器BeanPostProcessor
先回顾bean生命周期的这张图,看看BeanPostProcessor调用位置 通过上图看到BeanPostProcessor(Bean后置处理器)两个方法在bean生命周期的位置,即:在Spring容器完成Bean实例化和属性设置后,并且在bean调用初始化方法之前或之后。因此BeanPostProcessor(Bean后置处理器)常用在:对bean内部的值进行修改;实现Bean的动态代理等...
2018-08-09 15:50:45 294
转载 Spring容器扩展点:后置处理器BeanFactoryPostProcessor
BeanPostProcessor(Bean后置处理器)常用在对bean内部的值进行修改;实现Bean的动态代理等。 BeanFactoryPostProcessor和BeanPostProcessor都是spring初始化bean时对外暴露的扩展点。但它们有什么区别呢? 由《理解Bean生命周期》的图可知:BeanFactoryPostProcessor是生命周期中最早被调用的,远远早于Be...
2018-08-09 14:44:37 269
原创 mysql的insert ignore插入问题
对于主键冲突的时候,自动忽略当前要插入的记录。违反唯一性约束的时候,同样丢弃当前要插入的数据。可以用在数据同步的场景,这个场景数据源只有insert 的操作,如果数据源含有update就会失败,不能同步update的更新字段。这样做到最终一致和幂等 insert into 表示插入数据,数据库会检查主键(PrimaryKey),如果出现重复会报错insert ignore into 表...
2018-08-08 15:03:20 4511
转载 ConnectTimeout和ReadTimeout所代表的意义
ConnectTimeout 指的是建立连接所用的时间,适用于网络状况正常的情况下,两端连接所用的时间。 在java中,网络状况正常的情况下,例如使用 HttpClient 或者 HttpURLConnetion 连接时设置参数 connectTimeout=5000 即5秒,如果连接用时超过5秒就是抛出 java.net.SocketException: connetct time out...
2018-08-07 20:49:35 20200
转载 Redis集群:集群常用命令及说明
一、本文目的 介绍集群的基本情况及常用命令 二、集群的特点 3、集群优缺点 三、集群客户端命令(redis-cli -c -p port)集群cluster info :打印集群的信息cluster nodes :列出集群当前已知的所有节点( node),以及这些节点的相关信息。节点cluster meet <ip> &...
2018-08-04 09:45:50 3159
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人