自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 scala操作MySQL插件ScalikeJDBC的使用

Scala操作MySQL插件ScalikeJDBC的使用1.什么是ScalikeJDBC​ ScalikeJDBC是一款给Scala开发者使用的简洁DB访问类库,它是基于SQL的,使用者只需要关注SQL逻辑的编写,所有的数据库操作都交给ScalikeJDBC。这个类库内置包含了JDBC API,并且给用户提供了简单易用并且非常灵活的API。并且,QueryDSL(通用查询查询框架)使你的代码...

2019-04-21 22:58:31 392

原创 hive源码编译支持UDF函数

hive源码编译支持UDF函数1.源码下载​ 下载的hive源码最好跟自己hadoop环境的版本一致,我使用的hadoop-2.6.0-cdh5.7.0,所以以下过程都是基于这个版本操作的。源码下载地址:http://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.7.0.tar.gz2.编译支持UDF使用的是maven进行编译的,ma...

2019-04-21 19:10:09 202

原创 hive自定义UDF函数

hive自定义UDF函数1.什么是udf​ UDF(User-Defined Functions)即是用户自定义的hive函数。hive自带的函数并不能完全满足业务的需求,这时就需要我们自定义函数了。官网参考地址:LanguageManual UDF2.UDF分类1.UDF:one to one ,进来一个出去一个,row mapping。 是row级别操作,如:upper、subs...

2019-04-21 19:07:36 2894

原创 hue-3.9-cdh-5.7.0安装

hue-3.9-cdh-5.7.0安装​ 本次安装踩了一个大坑,由于之前先rpm方式安装了mysql,把centos7自带的mariadb删除了,用yum方式安装mysql-devel失败了,所以使用了rpm的方式安装hue。1.下载安装包下载地址:http://archive.cloudera.com/cdh5/redhat/5/x86_64/cdh/5.7.0/RPMS/x86_64/...

2019-04-18 00:37:22 636 1

原创 hadoop编译支持LZO压缩格式

hadoop编译支持LZO压缩格式1.lzo安装1.1 lzo格式文件压缩解压需要用到服务器的lzop工具,hadoop 的native库(hadoop checknative是没有的lzo,zip相关信息)并不支持#检查是否有lzop命令[hadoop@hadoop001 software]$ which lzop/bin/lzop#若没有执行如下安装命令[root@hadoop0...

2019-04-17 12:00:17 847 2

原创 Hadoop高级之HDFS&YARN HA架构剖析

Hadoop高级之HDFS&YARN HA架构剖析1.为什么要用集群​ 学习过程中我们只需要单点就够了,学习需要用到集群的时候可以使用便宜的商业集群.在企业里边肯定是使用的集群.我们自己部署的伪分布式,每个角色都是一个进程.2.HDFS:NN(NameNode): master(老大)SNN(Secondary NameNode):checkpoint second...

2019-04-16 18:47:47 326

原创 Git项目提交新建仓库

Git项目提交新建仓库​ 作为程序员,跟git打交道必不可少,但是往往会遇到项目写好了,但是要传到git仓库上去.如何将本地的项目和远程的仓库进行连接管理就是必修课了.​ 其实说起来也很简单,就是 git remote add origin 远程地址名1.本地项目执行操作1.在本地项目目录下初始化 git 仓库git init2.将本地项目下工作区的所有文件添加到 git 版...

2019-04-16 09:11:11 119

原创 shell之发送邮件(附件及html格式)

shell之发送qq邮件并附带附件1.生成qq登录授权码​ 以QQ邮箱为例,发送邮件的时候需要打开smtp功能,在QQ邮箱的设置–>账户,下面可以找到。2.服务器配置2.1关闭sendmail的服务#这台机器没有安装所以不显示[root@hadoop001 scripts]# service sendmail statusRedirecting to /bin/systemc...

2019-04-16 01:45:34 2878

原创 shell之常用编程语法

shell之常用编程语法1.shell编程规范shell文件行业规范默认后缀为.shshell首行为#!/bin/bash,注意/bin/bash为当前脚本解释器,可以不写但不能写错了。#表示注释shell对大小写敏感,变量尽量全大写,小写会被鄙视2.变量2.1环境变量全局生效,通过set命令查看,用户环境变量,当前用户生效,系统环境变量,所有用户生效,通过export声...

2019-04-16 01:45:08 309

原创 Hadoop离线项目之数据清洗

Hadoop离线项目之数据清洗1.背景1.1 企业级大数据项目开发流程项目调研:技术?业务?​ 以业务为导向的项目调研,根据不同的行业对项目进行调研,主要以 产品经理、非常熟悉业务的、项目经理等人员进行项目调研.需求分析:明确做什么 做成什么样子的(做东西不要局限于某个技术)​ 首先需求是由用户提出,是可见的,明确规定了需要什么,其次是隐式的需求,隐式的需求需要开发...

2019-04-15 17:34:10 939

原创 Hadoop-2.6.0-cdh5.7.0编译支持压缩

Hadoop-2.6.0-cdh5.7.0编译支持压缩Hadoop-2.6.0-cdh5.7.0本身是没有进行压缩支持的,但是我们在生产环境进行操作的时候,必须要进行压缩处理.1. 压缩的好处和坏处​ 好处减少存储磁盘空间降低IO(网络的IO和磁盘的IO)加快数据在磁盘和网络中的传输速度,从而提高系统的处理速度​ 坏处由于使用数据时,需要先将数据解...

2019-04-10 18:37:28 376

原创 HDFS&YARN HA部署

HDFS&YARN HA部署一:集群资源集群资源:3台4核4G的服务器(hadoop001,hadoop002,hadoop003),均为阿里云服务器需要的安装包:​ 1.jdk压缩包(jdk-8u45-linux-x64.gz)​ 2.Hadoop压缩包(hadoop-2.6.0-cdh5.7.0.tar.gz)​ 3.Zookeeper压缩包(zookeep...

2019-04-10 18:34:06 261

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除