自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(460)
  • 资源 (18)
  • 收藏
  • 关注

原创 MySQL 精华总结(收藏版)

写在之前:不建议那种上来就是各种面试题罗列,然后背书式的去记忆,对技术的提升帮助很小,对正经面试也没什么帮助,有点东西的面试官深挖下就懵逼了。个人建议把面试题看作是费曼学习法中的回顾、简化的环节,准备面试的时候,跟着题目先自己讲给自己听,看看自己会满意吗,不满意就继续学习这个点,如此反复,好的offer离你不远的,奥利给文章收录在 GitHub JavaKeeper ,N线互联网开发必备技能兵器谱,笔记自取。一、MySQL架构和其它数据库相比,MySQL有点与众不同,它的架构可以在多...

2020-07-25 10:39:29 821 1

原创 2019年中国航空三字代码对照表完全汇总

国际航空三字代码 IATA 中国 ZG NAY 北京南苑机场 NAY 国际航空三字代码 IATA 中国 ZG PEK 北京首都国际机场 PEK 国际航空三字代码 IATA 中国 ZG TSN 天津滨海国际机场 TSN 国际航空三字代码 IATA 中国 ZG ...

2019-01-03 15:49:18 19082 2

原创 2023-Hive调优最全指南

2023年Hive调优最全指南

2023-03-22 16:28:25 244

原创 2023-DataWorks数仓开发手册收藏版

目前的数仓为离线数仓,因此DataWorks开发主要涉及到离线数据集成和数据模型开发,因此本节也是分两部分来描述。

2023-03-22 16:08:24 251

原创 2023企业级数仓建设概要

数据仓库具有面向主题的特性,那么就会有主题的概念,同时,数仓建设是遵循纵向分层开发,横向划分主题域设计,遵循以下这个架构图,我们就可以以类似二维图清晰地定位出数据,这也从宏观上体现了数据资产中的数据组织。自此无忧搬家主题域数据仓库建设目前已介绍完毕。

2023-03-22 15:56:40 79

原创 2023数据中台-模型设计

本文主要了解了数据中台的模型设计。从确⽴设计⽬标,到通过⼀系列步骤,将⼀个个分散的、杂乱的、烟囱式的⼩数仓逐步规整到⼀个可复⽤、可共享的数据中台,最后通过产品化的⽅式实现系统化的管理。最后,再强调⼏个点:1. 完善度、复⽤度和规范度构成了衡量数据中台模型设计的度量体系,可以帮助你评估数仓设计的好坏。2. 维度设计是维度建模的灵魂,也是数据中台模型设计的基础,维度设计的核⼼是构建⼀致性维度。3. 事实表的统计粒度必须保持⼀致,不同统计粒度的数据不能出现在同⼀个事实表中。

2023-03-22 15:53:32 174

原创 2023深度解析数据治理平台建设

数据治理

2023-03-22 15:45:47 286

原创 2023年数据库优化顶级原理

2023年数据库优化顶级原理

2023-01-28 14:34:09 505

原创 开源大数据工具整理

开源大数据工具整理

2022-12-19 10:03:02 723

原创 开源数据集成引擎 BitSail

开源数据集成引擎 BitSail

2022-12-19 09:47:01 318

原创 Flink CDC-2.3版本概述

Flink CDC-2.3版本概述

2022-12-05 10:13:40 1315

原创 数据质量评价体系参考

数据质量评价体系参考

2022-11-15 16:38:38 187

原创 2022数据血缘关系详解

2022数据血缘关系详解

2022-09-26 09:18:52 1785

原创 元数据治理:产品方案介绍及案例实践

元数据治理:产品方案介绍及案例实践

2022-09-23 14:17:44 257 1

原创 SQL 优化大全【收藏版】

SQL 优化大全【收藏版】

2022-09-23 14:13:38 192

原创 如何保障数仓数据质量?

如何保障数仓数据质量?

2022-09-23 14:06:20 109

原创 Python实现10大排序算法

Python实现10大排序算法

2022-09-23 14:01:30 69

原创 数据仓库模型设计(收藏版)

数据仓库模型设计(收藏版)

2022-09-21 09:20:26 868

原创 Hive SQL 高级函数使用

Hive SQL 高级函数使用

2022-08-26 09:22:46 772

原创 数据仓库指标体系搭建实战

数据仓库指标体系搭建实战

2022-08-26 09:21:10 221

原创 Spark数据倾斜处理过程记录

Spark数据倾斜处理过程记录

2022-08-26 09:18:14 87

原创 SQL BOY 4 款脚本工具利器

SQL BOY 4 款脚本工具利器

2022-08-26 09:10:00 250

原创 如何保障数仓数据质量?

如何保障数仓数据质量?

2022-08-16 13:22:43 196 1

原创 大数据生态圈完整知识体系

大数据生态圈完整知识体系

2022-08-16 13:19:47 892 1

原创 Hive、SparkSQL是如何决定写文件的数量的?

Hive、SparkSQL是如何决定写文件的数量的?

2022-08-16 13:18:02 209

原创 详述Hive企业级开发优化

详述Hive企业级开发优化

2022-08-16 13:17:09 188

原创 Datax3.0+DataX-Web打造分布式可视化ETL系统

Datax3.0+DataX-Web打造分布式可视化ETL系统

2022-08-16 13:15:01 871

原创 Spark读取Hive表后会有多少个Task?

Spark读取Hive表后会有多少个Task?

2022-08-04 10:57:06 315

原创 Hive数仓建表数据存储格式选型方法

Hive数仓建表数据存储格式选型方法

2022-08-04 10:14:23 458 1

原创 2022年 SQL 优化大全总结详解

SQL优化总结

2022-08-02 15:09:38 172

原创 2022用户画像构建

2022用户画像构建

2022-08-02 14:59:24 218

原创 数据仓库指标体系实践

数据仓库指标体系实践

2022-08-02 14:50:11 154

原创 MySQL主从复制配置详解

MySQL主从复制配置详解

2022-07-26 09:19:47 98

原创 数据湖--概念、特征、架构与案例概述

数据湖--概念、特征、架构与案例概述

2022-07-26 09:13:46 358 1

原创 指标和标签是做什么的

指标和标签概述

2022-07-26 09:03:43 349

原创 2022搭建企业级数据治理体系

搭建企业级数据治理体系

2022-07-26 09:00:46 184

原创 数据标准详细概述-2022

数据标准详细概述-2022

2022-07-21 10:01:10 4832

原创 数据模型设计方法概述

数据模型设计方法概述

2022-07-21 09:46:43 291

原创 数仓数据标准详解-2022

数仓数据标准详解-2022

2022-07-21 09:30:05 477 1

原创 如何提升数据质量

如何提升数据质量

2022-07-19 09:24:35 108

Flume 抽取MYSQL Oracle数据 JSON格式 推送Kafka

Flume二次开发,支持抽取MYSQL Oracle数据库数据 以JSON格式推送至Kafka。 demo: sql_json.sources.sql_source.type = com.hbn.rdb.source.SQLSource sql_json.sources.sql_source.connectionurl = jdbc:oracle:thin:@IP:PORT/orcl sql_json.sources.sql_source.driverclass= oracle.jdbc.driver.OracleDriver sql_json.sources.sql_source.filename = sqlSource.status sql_json.sources.sql_source.customquery = SELECT INTID,ID_NO FROM TEST.TEST sql_json.sources.sql_source.begin = 0 sql_json.sources.sql_source.autoincrementfield = INTID

2022-05-28

lxml_liunx_python2.7.zip

lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高 XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言,它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索 XPath的选择功能十分强大,它提供了非常简明的路径选择表达式,另外,它还提供了超过100个内建函数,用于字符串、数值、时间的匹配以及节点、序列的处理等,几乎所有我们想要定位的节点,都可以用XPath来选择.直接下载,然后放入Linux-python文件夹即可。

2021-03-11

flume-ng-elasticsearch-sink-1.8.0.jar

在Flume中的ElasticSearchSink支持Flume与Elasticsearch整合,可以将Flume采集的数据传输到Elasticsearch中,Flume版本:1.8.0,ElasticSearchSink版本:6.2.4

2020-09-18

kettle资源库表详细说明文档.xls

资源库是用来保存转换任务的,用户通过图形界面创建的的转换任务可以保存在资源库中。 资源库可以使多用户共享转换任务,转换任务在资源库中是以文件夹形式分组管理的,用户可以自定义文件夹名称。

2020-04-30

kettle资源库数据字典.xls

Kettle资源库数据字典明细:R_DATABASE:数据库连接信息 R_DIRECTORY:kettle程序目录 R_JOB:作业 R_JOB_ATTRIBUTE:作业属性 R_JOB_HOP:作业跳 R_JOB_NOTE:作业注解 R_JOBENTRY:作业项 R_JOBENTRY_ATTRIBUTE:作业项属性 R_JOBENTRY_COPY:拷贝的作业项

2020-04-30

2020年中国行政区划四级街道镇标准GB-T2260(EXCEL版本).xlsx

《中国行政区划代码》国家标准(GB/T2260)是行政区划代码,也称行政代码。 行政区划代码是国家行政机关的识别符号,由9位阿拉伯数字组成,相当于机关单位的身份号码。 按照国务院《行政区划管理条例》规定,行政区划代码由民政部门确定、发布。2020年最新发布行政区划四级街道/镇/乡。

2020-04-23

pentaho-hadoop-shims-cdh513-package-8.3.2019.05.00-371-dist.zip

大数据ETL开源软件Kettle连接Hadoop时使用到得Shims 配置Pentaho组件Shims Shims是Pentaho提供的一系列连接各个source的适配器,具体配置位置根据Pentaho的组件来决定,现在的PDI Spoon的配置位置在../data-integration/plugins/pentaho-big-data-plugin/hadoop-configurations 下,注意这个地方要配置好对应数据源的shims

2020-03-20

pentaho-hadoop-shims-cdh57-package-70.2016.10.00-25-dist.zip

大数据ETL开源软件Kettle连接Hadoop时使用到得Shims 配置Pentaho组件Shims Shims是Pentaho提供的一系列连接各个source的适配器,具体配置位置根据Pentaho的组件来决定,现在的PDI Spoon的配置位置在../data-integration/plugins/pentaho-big-data-plugin/hadoop-configurations 下,注意这个地方要配置好对应数据源的shims

2020-03-20

pentaho-hadoop-shims-cdh514-package-8.3.2019.05.00-371-dist.zip

大数据ETL开源软件Kettle连接Hadoop时使用到得Shims 配置Pentaho组件Shims Shims是Pentaho提供的一系列连接各个source的适配器,具体配置位置根据Pentaho的组件来决定,现在的PDI Spoon的配置位置在../data-integration/plugins/pentaho-big-data-plugin/hadoop-configurations 下,注意这个地方要配置好对应数据源的shims

2020-03-19

pentaho-hadoop-shims-cdh58-package-70.2016.10.00-25-dist.zip

大数据ETL开源软件Kettle连接Hadoop时使用到得Shims 配置Pentaho组件Shims Shims是Pentaho提供的一系列连接各个source的适配器,具体配置位置根据Pentaho的组件来决定,现在的PDI Spoon的配置位置在../data-integration/plugins/pentaho-big-data-plugin/hadoop-configurations 下,注意这个地方要配置好对应数据源的shims

2020-03-19

Araxis Merge v6.5 NSIS文本对比.rar

Araxis Merge 是一款专业的可视化文件比较以及合并和同步的软件,同时也是该软件目前最新的版本,新版带来了全新的功能以及优化,包括合并使您能够比较和处理不同版本的文本文件,如程序源代码,XML和HTML文件。合并可以从Microsoft Office,OpenDocument,PDF和RTF文件中提取和比较文本。XML文件可以以特殊格式显示,帮助您更清楚地看到更改。它支持ASCII,MBCS和Unicode字符编码的文件。

2019-12-19

WinRAR_5.50_x64_SC.rar

WinRAR压缩软件是一款解压缩软件,电脑装机所需的软件之一,解压缩免费,WinRAR 64位支持目前绝大部分的压缩文件格式,Winrar包含强力压缩、分卷、加密和自解压模块。下载安装,去广告纯净版.

2019-12-11

xdown-1.0.1.4.zip

Xdown是一款超级强大的开源免费无广告的Torrent/磁力链/百度云下载神器。Xdown不光如此还支持BT,免费的IDM+torrent 可以多线程128并发的下载工具.

2019-12-11

z501_touchpad_win7.rar

TOUCHPAD采用多指触控技术,突破性实现了多个手指触摸行为的组合行为识别。通过不同自定义手势,可以轻松完成开启、翻页、伸缩等多种强大功能,实现了用简单的手指触摸行为完成复杂的人机交互。 下载安装即可,非常方便

2019-12-11

influxdb_demo.zip

InfluxDB(时序数据库),常用的一种使用场景:监控数据统计。每毫秒记录一下电脑内存的使用情况,然后就可以根据统计的数据,利用图形化界面(InfluxDB V1一般配合Grafana)制作内存使用情况的折线图; 可以理解为按时间记录一些数据(常用的监控数据、埋点统计数据等),然后制作图表做统计;

2019-11-22

KeyFreeze键盘鼠标上锁工具

KeyFreeze键盘鼠标上锁工具,直接解压,并运行KeyFreeze.exe,点击右键设置;锁住键盘和鼠标,解锁Ctrl+F

2019-11-15

GitHub Windows版本 客户端

GitHub Windows版本 客户端直接解压,安装即可使用,直接登录GitHub,方便提交代码以及维护代码

2019-11-15

raidrive-1-8-0版本网盘映射到本地磁盘工具

RaiDrive是能够将一些网盘映射为本地网络磁盘的工具,RaiDrive可以方便的将网盘映射为本机的网络磁盘,而在支持的网盘有Google Drive, Google Shared drives,Google Photos, OneDrive, SharePoint,Dropbox, Box, pCloud, Yandex Disk,WebDAV, SFTP, FTP

2019-11-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除