自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 发送邮件示例代码

多种语言实现发送邮件功能Python实现发送邮件功能Shell实现发送邮件功能Python实现发送邮件功能#!/usr/bin/python# -*- coding: UTF-8 -*-# 首先导入email模块构造邮件from email.mime.multipart import MIMEMultipartfrom email.header import Headerfrom email.mime.text import MIMETextfrom email.mime.applicat

2021-01-27 14:23:29 541

原创 在CDH中查看各组件的版本号

在CDH中查看各组件的版本号1、选择 主机 —— 所有主机2、点击其中一台节点3、进去以后,选择 组件

2020-12-09 14:53:05 1074

原创 数仓分层结构

数据仓库(Data Warehouse)简写DW,在一般企业中,由下到上依次分为:DWD、DWB或DWM、DWS。第一层:数据明细层DWD(data warehouse detail):是业务层与数据仓库的隔离层。第二层:数据中间层DWM(date warehouse middle)或者叫DWB(data warehouse base):存储的是客观数据,一般用作中间层,可以认为是大量指标的数据层。第三层:数据服务层DWS(data warehouse service):基于DWB上的基础数.

2020-10-15 14:20:02 811

转载 替换系统自带yum源(针对执行yum出现未注册的情况)

文章转载自:https://blog.csdn.net/otmqixi/article/details/81564515我们安装好RHEL的Linux后,执行yum命令安装软件,如果是未注册的肯定会出现This system is not registered with an entitlement server. You can use subscription-manager to regi...

2019-05-02 10:07:37 1308

原创 HBase知识摘要(一)

HBase面向列的数据库,NoSQL数据库。

2019-03-30 23:40:53 564

原创 解决错误:org.apache.hadoop.mapreduce.lib.input.InvalidInputException:

**错误信息:**Exception in thread “main” org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://192.168.127.11:9000/root/data/a.txt**描述:**找了老半天,网上也有说是9000端口被占用。其实都...

2019-01-11 23:22:29 4962 1

原创 Maxwell实时监听Binlog单机demo

文章目录需要环境配置Linux环境下MySQL开启Binlog配置Maxwell数据库权限创建数据库配置Kafka并启动Maxwell需要环境Linux环境MySQL (版本:5.7.19)kafka (版本:kafka_2.11-1.0.0)zookeeper (版本:zookeeper-3.4.10)Maxwell (版本:maxwell-...

2019-01-09 12:27:30 993

翻译 Flume Agent吞吐量优化方法

译自:Scaling a flume agent to handle 120K events_sec – Data Collective – MediumApache Flume 是一种用来收集大量数据(如日志)的分布式服务。Flume agent 有三个组成部分:source, channel and sink.。简而言之,数据通过Channel从Source到Sink。Source生产数...

2019-01-05 15:49:28 3078 2

转载 大数据环境下该如何优雅地设计数据分层

 最近出现了好几次同样的对话场景:问:你是做什么的?答:最近在搞数据仓库。问:哦,你是传统行业的吧,我是搞大数据的。答:......发个牢骚,搞大数据的也得建设数据仓库吧。而且不管是传统行业还是现在的互联网公司,都需要对数据仓库有一定的重视,而不是谈一句自己是搞大数据的就很厉害了。数据仓库更多代表的是一种对数据的管理和使用的方式,它是一整套包括了etl、调度、建模在内的完整的理论体...

2019-01-03 17:16:21 1071

转载 算法中时间复杂度概括——o(1)、o(n)、o(logn)、o(nlogn)

在描述算法复杂度时,经常用到o(1), o(n), o(logn), o(nlogn)来表示对应算法的时间复杂度。这里进行归纳一下它们代表的含义:这是算法的时空复杂度的表示。不仅仅用于表示时间复杂度,也用于表示空间复杂度。 O后面的括号中有一个函数,指明某个算法的耗时/耗空间与数据增长量之间的关系。其中的n代表输入数据的量。比如时间复杂度为O(n),就代表数据量增大几倍,耗时也增大几倍。比...

2018-11-18 19:39:14 8108

转载 Maven下载安装、Eclipse配置Maven详解

Maven下载安装的前提要保证已经配置好Java开发所需要的环境变量,即已经将jdk配置好。可以在命令行查看一下是否已经配置好。步骤...

2018-09-12 19:44:26 841

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除