自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

谦蓦的博客

风格不被定义,做自己。

  • 博客(6)
  • 资源 (1)
  • 收藏
  • 关注

原创 Airflow[v1.10]任务调度平台的安装教程

0.背景真的是想不通,Airflow不论社区活跃度还是Github的star数都是远胜于Azkaban还有EasyScheduler的,但是为何却连一个完备的安装教程都没有呢?是我的需求太高?真的是心累不已,整整把搜索引擎还有youtube翻来覆去也没让我感到满足……不过好在,一步一坑一脚印的最终搭建连通好了环境以及Operator。好了,废话不多说,开始Airflow今日份安装教程。1.安...

2019-06-14 03:42:00 1355 2

原创 如何对数仓进行建模

如何对数仓进行建模,点击链接前往

2019-06-12 00:25:37 1176

原创 基于Hadoop的数据仓库

1 什么是数据仓库数据仓库是面向主题的、集成的、具有时间特征的、稳定的数据集合,用以支持经营管理中的决策制定过程典型应用:报表生成数据分析数据挖掘数据仓库其他特征数据量非常大(TB以上)是数据库的一种新型应用使用人员较少商用数据仓库典型代表: db2, teradata, vertica价格昂贵,支持数据量通常TB或以下大数据时代数据仓库...

2019-06-10 01:18:03 5877

原创 了解一下数据仓库

0.什么是数据库?数据库(DB)是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库数据库是长期存储在计算机内、有组织的、可共享的数据集合。数据库中的数据指的是以一定的数据模型组织、描述和储存在一起、具有尽可能小的冗余度、较高的数据独立性和易扩展性的特点并可在一定范围内为多个用户共享1.什么是数据仓库?数据仓库是面向主题的,集成的,相对稳定的,反映历史变化的数据集...

2019-06-10 01:16:43 439

原创 Hive SQL查询效率提升之Analyze方案的实施

0.简介Analyze,分析表(也称为计算统计信息)是一种内置的Hive操作,可以执行该操作来收集表上的元数据信息。这可以极大的改善表上的查询时间,因为它收集构成表中数据的行计数,文件计数和文件大小(字节),并在执行之前将其提供给查询计划程序。1.如何分析表?基础分析语句ANALYZE TABLE my_database_name.my_table_name COMPUTE STAT...

2019-06-07 15:44:46 2618

原创 爱上Java诊断利器之Arthas

1. Arthas是什么?摘自Arthas的Github介绍: Arthas is a Java Diagnostic tool open sourced by Alibaba. Arthas allows developers to troubleshoot production issues for Java applications without modifying code ...

2019-06-06 23:46:45 4325 5

hive数据表-小文件合并代码(java)

小文件合并代码,

2023-08-08

软件构造项目案例

软件构造项目案例:电厂职工培训管理系统。培训计划、部门、学员CRUD操作。

2016-01-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除