自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Docker

1.docker介绍 2.环境 虚拟机centos7 网络配置 vi /etc/sysconfig/network-scripts/ifcfg-ens32 BOOTPROTO=static ONBOOT=yes IPADDR=192.168.100.129 NETMASK=255.255.255.0 GATEWAY=192.168.100.2 DNS1=192.168.100.2 # DNS与网关一致 3.docker安装部署 yum install -y yum-utils # 因为会使用到yum-

2020-07-03 15:59:21 253

原创 DataX

DataX 官方地址:https://github.com/alibaba/DataX 1.介绍 DataX是一款异构数据源离线同步工具,可实现例如关系型数据库(mysql、Oracle),非关系型数据库(HDFS、hive、HBase)等各种异构数据源之间稳定高效的数据同步功能 2.框架介绍 DataX作为离线数据同步框架,采用framework+plugin架构构建。将数据源读取和写入抽象成为Reader/Writer插件,纳入到整个同步框架中。 (1)Reader:Reader为数据采集模块,负责采

2020-06-30 14:22:02 598

原创 mysql笔记

注:最近出差,用到了MySQL,在这里复习一下~,Linux环境。 登录MySQL服务器 mysql -h127.0.0.1 -uroot -p[pwd -Ddb_name] -- 这样会直接进入该db_name库下 1.创建数据库 create database db_name; 2.创建用户及赋权 create user user_name@localhost identified by...

2019-12-25 16:14:33 171

原创 SQL之join连接方式

CBO(cost based optimizor)会根据join table的统计信息,选择Join算法、多表Join还有顺序问题。 join算法的三大连接方式: nested-loop join(嵌套循环连接) merge join(合并连接) hash join(哈希连接) 一:nested-loop join 嵌套循环连接,从外层循环表(默认为驱动表)的每一行开始循环遍历内层循环表(内表)直...

2019-06-12 16:19:12 357

原创 Hive

Hive笔记 –hive本质 将 SQL 语句转换为 MapReduce 任务运行 –查看hive版本 hive version –hive命令 hive #进入hive控制台 –查看数据库 show databases; –使用数据库 use default #默认default数据库 –查看数据库下表 show tables; –创建表(内部表) create table test( id...

2019-04-18 11:09:08 256

原创 QGIS3.4

QGIS笔记 –QGIS简介 1).开源,客户端程序 2).支持数据的可视化,管理,编辑与分析和印刷地图的制作 3).可运行在Linux、Unix、Mac OSX和Windows系统 4).支持多种矢量、栅格与数据库格式及功能 –安装QGIS 1).下载稳定版QGIS3.4 https://www.qgis.org/en/site/forusers/download.html# 2).如果不修改...

2019-04-17 15:51:36 3479

原创 HBase

HBase笔记 一:HBase简介 HBase是Big Table的开源版本,Java编写,是Hadoop的数据库,是建立在HDFS之上,被用来提供高可靠性,高性能,列存储,可伸缩,多版本的NoSQL的分布式数据存储系统,实现对大型数据的实时,随机的读写访问。 1).依赖于HDFS做底层的数据存储 2).依赖于MapReduce做数据计算 3).依赖于ZooKeeper做服务协调 4).HBase...

2019-04-16 11:07:47 144

原创 Python

python笔记 1.写入文件 with open(‘url’, mode=’’, excoding=‘utf-8’) as f: f.write(text) 2.爬虫 import requests response = requests.get(url, headers=headers, proxies=proxies, cookies=cookies) response.encoding =...

2019-04-13 19:35:27 164

原创 Azkaban

azkaban安装配置 一:前提条件: 安装MySQL 安装Git yum install git 二:azkaban安装 官网下载azkaban-3.70.0.tar.gz,rz上传至服务器/home/hadoop/apps,解压 tar -zxvf azkaban-3.70.0.tar.gz 在azkaban-3.70.0下编译 vi azkaban-3.70.0/azkaba...

2019-04-11 16:34:14 539 1

原创 sqoop

sqoop笔记 sqoop简介 sqoop 是 apache 旗下一款“Hadoop 和关系数据库服务器(RDBFS)之间传送数据”的工具。 sqoop原理 将sqoop命令翻译成MapReduce程序来实现,在翻译出的MapReduce中主要是对inputformat和outputformat进行定制 sqoop安装 –下载,解压 tar -zxvf xxx.tar –创建软连接,修...

2019-04-09 09:19:00 215

原创 xPath

xPath笔记 xPath介绍 xPath是一门在XML文档中查找信息的语言。xPath用于在XML文档中通过元素和属性进行导航 XML节点 节点:元素,属性,原子值(文本),处理指令,注释,根节点,命名空间 节点间关系:父(parent),子(children),兄弟(sibling),祖先(ancestor),后代(descendant) 路径 绝对路径:/ # 根节点 相对路径...

2019-04-08 13:51:51 1633

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除