紫竹星云

java程序员的成长之路

Kettle 使用教程(1)—入门

大数据的开发过程中使用的是Kettle为6.1.0版本简介Kettle是一款纯Java开发的ETL工具,它是跨平台的,所以它可以在Window、Linux、Unix上运行。注意什么是ETL,读者可以自行百度了解,我的理解是将一个数据库的数据导入到另外一个数据库中,当让这种说法并不严谨,因为数据传输...

2018-02-08 10:32:20

阅读数 2263

评论数 0

Hbase基本概念

1. HBase简介 1.1 什么是HBase HBASE是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBASE的目标是存储并处理大型的数据,更具体来说是仅需使用普通的硬件配置,就能够处理由成千上万的行和...

2019-04-25 09:39:03

阅读数 69

评论数 0

hbase测试题

1. HBase来源于哪篇博文? C A The Google File System B MapReduce C BigTable D Chubby 2. 下面对HBase的描述哪些是正确的? B、C、D A不是开源的 B是面向列的 C是分布式的 D是一种NoSQL数据库 3. HBase依...

2019-04-25 08:58:50

阅读数 59

评论数 0

hive中的几种排序的区别

hive的排序有四种: order by ,sort by,distribute by,cluster by 1、order by order by 是最常用的一种排序,全局排序,所有的数据会在一个reducer上面进行排序,所以一般使用这个函数进行排序的时候速度较慢。需要指出来的是,在str...

2019-04-23 16:04:42

阅读数 2

评论数 0

在hive中执行sql语句:SemanticException org.apache.hadoop.hive.ql.metadata.HiveException:

报错,查看日志文件,如下的报错: 原因:没有开启 metastore,需要先启动hive的metastore服务才行 bin/hive --service metastore

2019-04-23 11:56:12

阅读数 22

评论数 0

centos7 配置ip

有关于centos7获取IP地址的方法主要有两种,1:动态获取ip;2:设置静态IP地址 在配置网络之前我们先要知道centos的网卡名称是什么,centos7不再使用ifconfig命令,可通过命令IP addr查看,如图,网卡名为ens32,是没有IP地址的 1、动态获取ip(前提...

2019-03-01 15:38:34

阅读数 51

评论数 0

ajax使用技巧

1、ajax提交from表单 data:$("#formid").serialize() 2、同步和异步 async: false 3、使用流下载,报错:getOutputStream() already in use 解决方式:action 中...

2019-03-01 13:46:24

阅读数 93

评论数 0

搭建Cloudera Manager环境

本文主要介绍如何搭建Cloudera Manager环境来管理大数据集群。这里注重的是搭建的过程,所以小编没用公司的服务器,而是在自己电脑上建了三台虚拟机(使用的是CentOS6.5),用作搭建Cloudera Manager环境。 目录 一、环境准备(在所有机器上操作) 二、集群时间服务器...

2019-03-01 10:39:22

阅读数 95

评论数 0

大数据全套教学视频,看仔细了是视频!

1、Hadoop—Spark企业应用实战强烈推荐版视频教程  链接: https://pan.baidu.com/s/1F082k-5oME38T-L8_AJn5g 密码: kfm7 2、Hadoop+Storm+Spark入门进阶实战视频教程 链接: https://pan.baidu.c...

2019-02-15 09:13:56

阅读数 82

评论数 0

eclipse中安装python插件

1.下载python.exe安装 http://mirrors.sohu.com/python/2.6.5/python-2.6.5rc2.msi win7安装时,中间有段时间需要等待很长时间 2.下载pydev http://sourceforge.net/projects/pydev/...

2019-01-30 14:24:39

阅读数 28

评论数 0

hive中常用的时间处理函数

日期函数UNIX时间戳转日期函数: from_unixtime语法:   from_unixtime(bigint unixtime[, string format]) 返回值: string 说明: 转化UNIX时间戳(从1970-01-01 00:00:00 UTC到指定时间的秒数)到当前...

2019-01-16 16:01:26

阅读数 184

评论数 0

MR_wordcount的java编程实例

 

2018-12-25 13:24:45

阅读数 33

评论数 0

eclipse中安装hadoop插件并运行wordcount

1:首先下载我们需要的  hadoop-eclipse-plugin-2.7.3.jar,winutils.exe 和 hadoop.dll 链接地址: 2:解压hadoop软件,并且安装到D盘的一个英文路径 3:把hadoop.dll和winutile.exe放到hadoop的bin文件夹...

2018-12-25 11:36:42

阅读数 91

评论数 0

myeclipse下搭建hadoop2.7.3开发环境

一  下载并编译  hadoop-eclipse-plugin-2.7.3.jar 二  将hadoop-eclipse-plugin-2.7.3.jar放到myeclipse的安装目录下的plugins目录下,并重启myeclipse   在windows->prefe...

2018-12-21 10:43:33

阅读数 30

评论数 0

IP地址,子网掩码,默认网关,DNS服务器详解

为了更深入的学习TCP/IP协议,最近看了不少有关资料,收集整理记录如下,以备后面的使用和方便各位学习:    IP地址,子网掩码,默认网关,DNS服务器是什么意思?  (一)  问题解析 001.   问:  IP地址,子网掩码,默认网关,DNS服务器,有什么区别呀?我知道没有IP地址就...

2018-12-12 16:20:57

阅读数 178

评论数 1

maven中搭建nexus-3.14私服

一、试验环境 1、操作系统:Windows 10  2、nexus版本:nexus-3.14.0-04-win64 Nexus常用功能就是:指定私服的中央地址、将自己的Maven项目指定到私服地址、从私服下载中央库的项目索引、从私服仓库下载依赖组件、将第三方项目jar上传到私服供其他项目组使用...

2018-12-10 14:20:13

阅读数 434

评论数 2

redis安装到window的服务管理中

##安装到window的服务管理中: ##cmd中,到redis的解压目录:执行命令 redis-server --service-install redis.windows.conf ##可以在服务中,redis服务,直接启动,或者cmd,redis的解压目录中执行命令 redis...

2018-12-06 15:46:53

阅读数 33

评论数 0

echart图表x轴字数太长

axisLabel:{ formatter:function(params){ var newStr = ""; var n = params.length; var a...

2018-12-06 15:18:43

阅读数 309

评论数 0

echart地图鼠标悬浮展示多类数据

tooltip: { //trigger: 'item', formatter: '{b}:{c}' enterable:true, trigger:'item', formatter:function(par...

2018-12-06 15:18:03

阅读数 241

评论数 0

echart 处理x轴字数

//echart 处理x轴字数 太多的问题; 1.设置倾斜度 axisLabel:{interval:0,rotate:"45"}, 注:interval=0强制显示所有的项; 2.换行设置 axisLabel:{ formatter:fu...

2018-12-06 15:12:51

阅读数 103

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭