自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Docker

1.docker介绍2.环境虚拟机centos7网络配置vi /etc/sysconfig/network-scripts/ifcfg-ens32BOOTPROTO=staticONBOOT=yesIPADDR=192.168.100.129NETMASK=255.255.255.0GATEWAY=192.168.100.2DNS1=192.168.100.2 # DNS与网关一致3.docker安装部署yum install -y yum-utils # 因为会使用到yum-

2020-07-03 15:59:21 193

原创 DataX

DataX官方地址:https://github.com/alibaba/DataX1.介绍DataX是一款异构数据源离线同步工具,可实现例如关系型数据库(mysql、Oracle),非关系型数据库(HDFS、hive、HBase)等各种异构数据源之间稳定高效的数据同步功能2.框架介绍DataX作为离线数据同步框架,采用framework+plugin架构构建。将数据源读取和写入抽象成为Reader/Writer插件,纳入到整个同步框架中。(1)Reader:Reader为数据采集模块,负责采

2020-06-30 14:22:02 533

原创 mysql笔记

注:最近出差,用到了MySQL,在这里复习一下~,Linux环境。登录MySQL服务器mysql -h127.0.0.1 -uroot -p[pwd -Ddb_name] -- 这样会直接进入该db_name库下1.创建数据库create database db_name;2.创建用户及赋权create user user_name@localhost identified by...

2019-12-25 16:14:33 130

原创 SQL之join连接方式

CBO(cost based optimizor)会根据join table的统计信息,选择Join算法、多表Join还有顺序问题。join算法的三大连接方式:nested-loop join(嵌套循环连接)merge join(合并连接)hash join(哈希连接)一:nested-loop join嵌套循环连接,从外层循环表(默认为驱动表)的每一行开始循环遍历内层循环表(内表)直...

2019-06-12 16:19:12 288

原创 Hive

Hive笔记–hive本质将 SQL 语句转换为 MapReduce 任务运行–查看hive版本hive version–hive命令hive #进入hive控制台–查看数据库show databases;–使用数据库use default #默认default数据库–查看数据库下表show tables;–创建表(内部表)create table test(id...

2019-04-18 11:09:08 212

原创 QGIS3.4

QGIS笔记–QGIS简介1).开源,客户端程序2).支持数据的可视化,管理,编辑与分析和印刷地图的制作3).可运行在Linux、Unix、Mac OSX和Windows系统4).支持多种矢量、栅格与数据库格式及功能–安装QGIS1).下载稳定版QGIS3.4https://www.qgis.org/en/site/forusers/download.html#2).如果不修改...

2019-04-17 15:51:36 3369

原创 HBase

HBase笔记一:HBase简介HBase是Big Table的开源版本,Java编写,是Hadoop的数据库,是建立在HDFS之上,被用来提供高可靠性,高性能,列存储,可伸缩,多版本的NoSQL的分布式数据存储系统,实现对大型数据的实时,随机的读写访问。1).依赖于HDFS做底层的数据存储2).依赖于MapReduce做数据计算3).依赖于ZooKeeper做服务协调4).HBase...

2019-04-16 11:07:47 117

原创 Python

python笔记1.写入文件with open(‘url’, mode=’’, excoding=‘utf-8’) as f:f.write(text)2.爬虫import requestsresponse = requests.get(url, headers=headers, proxies=proxies, cookies=cookies)response.encoding =...

2019-04-13 19:35:27 132

原创 Azkaban

azkaban安装配置一:前提条件:安装MySQL安装Gityum install git二:azkaban安装官网下载azkaban-3.70.0.tar.gz,rz上传至服务器/home/hadoop/apps,解压tar -zxvf azkaban-3.70.0.tar.gz在azkaban-3.70.0下编译vi azkaban-3.70.0/azkaba...

2019-04-11 16:34:14 504 1

原创 sqoop

sqoop笔记sqoop简介sqoop 是 apache 旗下一款“Hadoop 和关系数据库服务器(RDBFS)之间传送数据”的工具。sqoop原理将sqoop命令翻译成MapReduce程序来实现,在翻译出的MapReduce中主要是对inputformat和outputformat进行定制sqoop安装–下载,解压tar -zxvf xxx.tar–创建软连接,修...

2019-04-09 09:19:00 188

原创 xPath

xPath笔记xPath介绍xPath是一门在XML文档中查找信息的语言。xPath用于在XML文档中通过元素和属性进行导航XML节点节点:元素,属性,原子值(文本),处理指令,注释,根节点,命名空间节点间关系:父(parent),子(children),兄弟(sibling),祖先(ancestor),后代(descendant)路径绝对路径:/ # 根节点相对路径...

2019-04-08 13:51:51 1574

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除