自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 数据相关常用名词,指标、标签、度量、口径、数据标准、血缘等名词解析

这里整理了数据人员,经常会接触到的名词和概念,了解这些专有名词对于数据研发和数据分析时,人员协作及研发都有很高的作用。

2023-01-30 20:10:03 300 1

原创 指标与标签的区别?

在公司数据建设过程中,经常会使用和提到指标和标签,但是很多小伙伴对于两者的区别确不能讲清楚。实际上标签与指标一样,是理解数据的两种方式,在赋能业务上,两者同样重要。接下来将结合自身的理解,从定义、应用场景、分类等多个方面进行总结。

2022-12-04 22:26:52 285

原创 5000字长文解析:带你解读阿里大数据建设方法论OneData

导读:在建设大数据数据仓库时,首先要进行充分的业务调研和需求分析,这是数据仓库建设的基石,业务调研和需求分析做得是否充分直接决定了数据仓库建设是否成功;其次,进行数据总体架构设计,主要是根据数据域对数据进行划分;按照维度建模理论,构建总线矩阵、抽象出业务过程和维度。再次对报表需求进行抽象整理出相关指标体系,使用OneData工具完成指标规范定义和模型设计。最后就是代码研发和运维。

2021-10-26 17:42:31 1351

原创 场景案例,最全面的Hive开窗函数讲解和实战指南(必看)

Hive 窗口函数不同于我们熟悉的常规函数及聚合函数,它为每行数据进行一次计算,特点是输入多行(一个窗口)、返回一个值。在报表等数据分析场景中,窗口函数真的很强大,灵活运用窗口函数可以解决很多复杂问题,比如去重、排名、同比及环比、连续登录等等。

2021-10-25 20:49:25 509

原创 深入浅出Hive数据倾斜,最全面的讲解(好文收藏)

导读:我们日常使用HIVE SQL的时候可能会遇到这样一个令人苦恼的场景:执行一个非常简单的SQL语句,任务的进度条长时间卡在99%,不确定还需多久才能结束,这种现象称之为数据倾斜。这一现象出现的原因在于数据研发工程师主要关注分析逻辑和数据结果的正确性,却很少关注SQL语句的执行过程与效率。

2021-10-24 12:35:22 3626

原创 90后程序员职场报告:月薪普遍过万 超七成有房有车 女性程序员不足一成

您知道吗程序员群体已经高达200万,学历和收入双高,月薪普遍过万,是北上广深最有机会购房的群体;社交圈子相对单一,能够忍受孤独寂寞;是理性的消费者,商家利用虚荣、从众心理的消费手段并不奏效,他们的世界崇尚技术实力,并不需要通过外貌或形象来获得别人的认同。他人眼中的程序员黑眼圈、青年肥、胡子拉碴、枯燥乏味,他们眼中的自己自信、强大、自制力强,乐观开朗。前言本报告针对程序员群体进行调研,围绕程序员的消费、婚恋、职场等现状,进行报告分析和观点论述。程序员人群画像一、程序员人数规模2020年,我国程.

2021-07-16 16:42:41 1278

原创 最值得阅读的数据仓库书籍推荐

从事数据仓库几年了,在工作学习过程也看了很多数据仓库方面的书,此处整理了对自己帮助较大的数据,在这里给大家总结推荐一下,希望能花最少的时间学到最多的东西。

2021-02-28 15:31:19 1051

原创 分享公司内部mysql使用规范

最近涉及数据库相关操作较多,公司现有规范也不是太全面,就根据网上各路大神的相关规范,整理了一些自用的规范用法,万望指正。数据库环境dev: 开发环境,开发可读写,可修改表结构。开发人员可以修改表结构,可以随意修改其中的数据但是需要保证不影响其他开发同事。test: 测试环境,开发可读写,开发人员可以通过工具修改表结构。online: 线上环境,开发人员不允许直接在线上环境进行数据库操作,如果需要操作必须找DBA进行操作并进行相应记录,禁止进行压力测试。重点的问题,各个环境的mysql服务器对应的

2020-08-09 17:53:19 258

原创 Mac OS 下 iTerm 实现使用 rz/sz 命令从服务器上传下载文件

在 windows 下通常可以用 xshell、secureCRT 等工具,只要在服务端装好 lrzsz 工具包就可以实现简单方便的文件上传下载。但是在 Mac Os 上用 iTerm 的时候发现 iTerm 原生不支持 rz/sz 命令,也就是不支持 Zmodem 来进行文件传输,下面就整理了怎么处理这种情况。Mac os 下 安装 lrzszbrew install lrzsz下载 Iterm2 使用 lrzsz 脚本cd /usr/local/bin# 克隆下载插件脚本git clon

2020-08-09 17:50:17 880

原创 亚马逊广告api v2版php扩展库

概述easy-amazon-advertisingeasy-amazon-advertising 是一个开源的非官方的亚马逊广告业务sdk。环境需求easy-amazon-advertising 的安装非常简单,因为它是一个标准的 Composer 包,这意味着任何满足下列安装条件的 PHP 项目支持 Composer 都可以使用它。php: >=7.2.0guzzlehttp...

2020-01-15 22:24:00 1172

原创 Mac VMware Fusion CentOS7 安装、配置静态IP文档

安装文档安装CentOS7这里我们要安装CentOS7 64位,所以选择CentOS7 64位配置我们点击存储后,vmware会自动帮我们创建一个虚拟机,但是我们还没有添加镜像,所以需要先将其关机给新创建的虚拟机设置镜像设置语言这里说一下设置成英文的原因,因为英文是更国际化的语言,设置成英文的以后系统出问题了就是英文错误提示,通过英文错误提示更容易在网络上搜...

2020-01-11 14:51:49 572 4

原创 MAC下搭建Hadoop运行环境

Hadoop环境的搭建和配置还是有些麻烦的,尤其是mac,此处整理下自己搭建的过程和步骤。

2019-07-20 22:18:56 14192 15

原创 Mac Os 安装配置Maven以及IntelliJ IDEA Maven使用

mac上安装maven、以及IDEA上Maven配置

2019-06-10 16:24:44 15025 1

原创 Mac配置Maven及IntelliJ IDEA Maven配置

mac上安装maven、以及IDEA上Maven配置目录下载Maven官方地址:http://maven.apache.org/download.cgi解压maventar -zxvf apache-maven-3.6.0-bin.tar.gz -C /Users/baihe/Software/apache-maven-3.6.1配置全局环境变量v...

2019-05-30 22:14:54 2908

原创 Mac 修改系统默认Java版本

Mac使用时,怎么去除修改系统默认Java版本流程方法查看当前版本,终端输入java -version查看存在的java sdk版本进入目录/Library/Java/JavaVirtualMachines复制需要更改的java sdk所在目录更新使用版本export JAVA_HOME=/Library/Java/JavaVirtualMachin...

2019-04-03 12:25:10 9121

原创 个人博客网站升级http为https

针对个人博客网站升级https,整理了下http和https的一些分析,以及配置方法目录HTTP与HTTPS是什么?HTTP协议(超文本传输协议)是互联网上应用最为广泛的一种网络协议,常被用于在web浏览器和网站服务器之间传递信息,http协议传输数据是以明文方式进行传送,如果中途被截获,就可以读取其中的信息。还记得之前公司某一台医疗设备的登录界面被截获,页面上都是广告的情况。为了解决HT...

2019-03-14 11:34:19 2624 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除