自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

mn_kw的博客

我就是我,不一样的IT男

  • 博客(12)
  • 资源 (6)
  • 收藏
  • 关注

原创 sql case when 去重

count(distinct case trainnumber when 'null' then 0 when '0' then 0 else trainnumber end) as train_num

2019-05-29 14:40:42 4741

原创 Hadoop web页面的授权设定

在core-siet.xml配置文件中增加如下三行<property> <name>hadoop.http.filter.initializers</name> <value>org.apache.hadoop.security.AuthenticationFilterIniti...

2019-05-28 09:58:06 2214

原创 sqoop 导入 hive

sqoop 导入 Hive 分三步:1. 先导入--target-dir 指定的 HDFS 的目录中2. 在 Hive 中建表3. 调用 Hive 的 LOAD DATA INPATH 把 --target-dir中的数据移动到 Hive 中import--hive-import--hive-table dw_hd.ods_store--connect jdbc:oracle:th...

2019-05-27 15:22:16 4381

原创 azkaban安装

首先将我们的安装包下载下来,总共是4个,一个是web,一个是executor,一个是solo,一个是sql然后解压到我们的linux机器上安装第一步:首先配置mysql1. 为Azkaban创建一个数据库:mysql> CREATE DATABASE azkaban;2. 为Azkaban创建一个数据库用户:mysql> CREATE USER '<...

2019-05-25 13:45:48 2084

原创 join理解

2019-05-21 11:38:01 265

原创 Ambari2.7.0离线部署

一、下载安装包wget http://public-repo-1.hortonworks.com/ambari/centos7/2.x/updates/2.7.0.0/ambari-2.7.0.0-centos7.tar.gzwget http://public-repo-1.hortonworks.com/HDP-UTILS-1.1.0.22/repos/centos7/HDP-UTIL...

2019-05-15 10:55:51 419

原创 Number of Under-Replicated Blocks问题

跑了一个mapreduce发现集群上出现了7个Under-Replicated Blocks,在web页面上能看到,在主节点上执行:$ bin/hadoop fsck -blocks删除导致问题的文件之后就好了。导致这个问题可能有俩个原因1. 可能我们默认得block副本因子是3,但是我们的datanode节点只有俩2个或者是1个这个时候就会出现这个有报错2. 我们mapper...

2019-05-09 09:13:30 3919

原创 将项目托管到gitHub

一、下载并安装Git版本控制工具下载地址:https://git-scm.com/downloads注册GitHub账号:https://github.com/为什么托管到GitHub要下载Git?  git是一个版本控制工具  github是一个用git做版本控制的项目托管平台。二、在IEDA中设置Git的位置以及跟你的GitHub账号连接起来...

2019-05-07 16:24:19 392

原创 web http方法

Post(新增),Put(修改),Delete(删除),Get(查询)GET:生到数据列表(默认),或者得到一条实体数据POST:添加服务端添加一条记录,记录实体为Form对象PUT:添加或修改服务端的一条记录,记录实体的Form对象,记录主键以GET方式进行传输DELETE:删除 服务端的一条记录...

2019-05-07 09:32:25 358

原创 在Linux下后台运行,程序运行前后台切换

一、为什么要使程序在后台执行我们计算的程序都是周期很长的,通常要几个小时甚至一个星期。我们用的环境是用Xshell远程连接到Linux服务器。所以使程序在后台跑有以下两个好处:1:我们这边是否关机不影响服务器的程序运行。(不会像以前那样,我们这网络一断开,或一关机,程序就断掉或找不到数据,跑了几天的程序只能重头再来,很是烦恼)2:让程序在后台跑后,不会占据终端,我们可以用终端做别的事情...

2019-05-07 08:56:38 4343 1

原创 kafka集群中jmx端口设置

jmx端口主要用来监控kafka集群的。在启动kafka的脚本kafka-server-start.sh中找到堆设置,添加export JMX_PORT="9999"if [ "x$KAFKA_HEAP_OPTS" = "x" ];then export KAFKA_HEAP_OPTS="-Xmx1G -Xms1G"export JMX_PORT="9999"fi...

2019-05-06 16:39:34 1345

转载 kafka-manager部署安装

一、kafka-manager 简介 为了简化开发者和服务工程师维护Kafka集群的工作,yahoo构建了一个叫做Kafka管理器的基于Web工具,叫做 Kafka Manager。这个管理工具可以很容易地发现分布在集群中的哪些topic分布不均匀,或者是分区在整个集群分布不均匀的的情况。它支持管理多个集群、选择副本、副本重新分配以及创建Topic。同时,这个管理工具也是一个非常好的可...

2019-05-06 15:27:26 4641

Ambari介绍、安装与应用案例

Ambari介绍、安装与应用案例,一键式搭建大数据平台,让我们更好的去应用和学习大数据平台

2018-12-06

Redis安装命令

Redis的安装命令,亲测,目前公司再用,如果有需要可以下载

2018-03-30

SVN服务端和客户端安装与使用

SVN安装与使用,自己亲自应用,不是从网上下载的,现在公司主要用的svn

2018-03-30

CentOS中时间同步(大数据平台搭建)

大数据平台搭建中时间同步需要的文档,可以在ambari中使用通过

2018-01-12

IntelliJ IDE中最新scala插件

IntelliJ IDE最新的scala插件,让我们在IDE中更好的集成scala

2017-08-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除