自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据技术派

代码改变世界,代码改变命运! | 微信搜索:大数据技术派

  • 博客(13)
  • 资源 (5)
  • 问答 (1)
  • 收藏
  • 关注

原创 数仓建模—宽表的设计

宽表的设计为什么要建设宽表宽表的好处和不足如何设计宽表总结宽表的设计其实宽表是数仓里面非常重要的一块,前面我们介绍过了维度表事实表,今天我们介绍一下宽表,前面我们说过了数仓是分层的,这是技......

2021-12-02 08:40:00 3056 1

原创 2021,我这一年

本文目录写作工作与学习阅读收入我的父亲2021,我这平凡的一年。这一年,说它平凡,一点也不为过。似乎从小到大,我所遭遇的一切事物,都是那么的平平常常。没有大起大落,没有日新月异。或许平静的...

2021-12-31 23:07:19 651

原创 Hbase构建二级索引的一些解决方案

hbase构建二级索引1 为什么需要二级索引HBase的一级索引就是rowkey,我们仅仅能通过rowkey进行检索。假设我们相对Hbase里面列族的列列进行一些组合查询,就只能全表扫描了...

2021-12-28 08:40:00 3451

转载 一册在手,走遍天下(大数据技术架构手册之上篇十四万字问世)

开头该公众号从19年开始注册,荒废了一年,大概从20年年底开始正式运营,早期定位是个人总结复盘,没有萌生以此作为副业的念头,开始的文章大多偏向于技术底层。21年看着身边的朋友搞公众号有了不...

2021-12-25 08:40:00 272

原创 Hive实战—时间滑动窗口计算

关注公众号:大数据技术派,回复资料,领取1024G资料。时间滑动计算外部调用实现时间循环自关联实现滑动时间窗口扩展基于自然周的的滚动时间窗口计算总结时间滑动计算今天遇到一个需求大致是这样的...

2021-12-23 08:40:00 2200

原创 数仓建模—指标体系

关注公众号:大数据技术派,回复资料,领取1024G资料。指标体系指标建设过程中遇到的问题指标建设方法论指标的构成如何设立指标体系评价指标体系指标管理场景落地总结指标体系提起指标这个词,每个...

2021-12-20 08:40:00 1490

转载 flink sql 知其所以然(十四):维表 join 的性能优化之路(上)附源码

看了那么多的技术文,你能明白作者想让你在读完文章后学到什么吗?大数据羊说的文章会让你明白博主会阐明博主期望本文能给小伙伴们带来什么帮助,让小伙伴萌能直观明白博主的心思博主会以实际的应用场景...

2021-12-19 08:40:00 1852

原创 Hive实战UDF 外部依赖文件找不到的问题

目录关于外部依赖文件找不到的问题为什么要使用外部依赖为什么idea 里面可以运行上线之后不行依赖文件直接打包在jar 包里面不香吗学会独立思考并且解决问题总结其实这篇文章的起源是,我司有数...

2021-12-15 08:40:00 4119 1

转载 突发!Log4j 爆“核弹级”漏洞,Flink、Kafka等至少十多个项目受影响

‍‍大数据技术交流群,扫码进入昨天,你应急了吗?昨晚,对很多程序员来说可能是一个不眠之夜。12 月 10 日凌晨,Apache 开源项目 Log4j 的远程代码执行漏洞细节被公开,由于...

2021-12-12 20:09:28 569

转载 干货|Spark优化之高性能Range Join

‍‍作者|张兴超编辑|林颖供稿|ADI Carmel Team本文共3884字,预计阅读时间10分钟导 读Carmel是eBay内部基于Apache Spark打造的一款SQL-on-H...

2021-12-10 08:40:00 535

转载 详解如何在数仓中管理元数据

‍‍‍‍大家好,元数据管理是企业数据治理的基础,是数据仓库建设的关键。作为一名数据人,首要任务就是理解元数据管理。本篇文章将为大家梳理元数据的概念,介绍元数据管理在数据仓库的地位、场景及实...

2021-12-07 08:40:00 1215

转载 flink sql 知其所以然(二)| 自定义 redis 数据维表(附源码)

感谢您的关注 + 点赞 + 再看,对博主的肯定,会督促博主持续的输出更多的优质实战内容!!!1.序篇-本文结构背景篇-为啥需要 redis 维表目标篇-做 redis 维表的预期效果是...

2021-12-03 08:40:00 2334 1

转载 大数据命令,一文在手,全部都有(送纯净版文档)

前言技术如同手中的水有了生命似的,汇聚在了一起。为了方便大家学习与工作查询资料。现生成大数据命令文档供大家参考。本总结只列举常用的命令,比较多的命令操作。比如linux,kafka命令就比...

2021-12-01 08:40:00 402

Zookeeper单机环境和集群环境搭建

Zookeeper单机环境和集群环境搭建

2023-06-15

虚拟机静态IP及多IP配置

虚拟机静态IP及多IP配置

2023-06-15

基于Zookeeper搭建Kafka高可用集群

基于Zookeeper搭建Kafka高可用集群

2023-06-15

基于Zookeeper搭建Hadoop高可用集群

基于Zookeeper搭建Hadoop高可用集群

2023-06-15

Storm集群环境搭建

Storm集群环境搭建

2023-06-15

Spark开发环境搭建

Spark开发环境搭建

2023-06-15

Spark集群环境搭建

Spark集群环境搭建

2023-06-15

Linux下Python安装

Linux下Python安装

2023-06-15

Linux下JDK安装

Linux下JDK安装

2023-06-15

Linux下Flume的安装

Linux下Flume的安装

2023-06-15

Linux环境下Hive的安装部署

Linux环境下Hive的安装部署

2023-06-15

HBase集群环境搭建

HBase集群环境搭建

2023-06-15

Hadoop集群环境搭建

Hadoop集群环境搭建

2023-06-15

docker 安装 wordpress,通过nginx反向代理,绑定域名,配置https

docker 安装 wordpress,通过nginx反向代理,绑定域名,配置https

2023-06-15

5分钟安装docker教程

5分钟安装docker教程

2023-06-15

2022年Python爬虫最全资料【6年爬虫经验精华总结】

【主要内容】 1. Python爬虫简介与环境安装 - Pythonn环境 - Selenium安装 - Python相关包 2. 基本库的使用 - 爬虫基本原理; - urlib库使用; - requests库使用; - bs4使用; - xpath和lxml使用; - selenium使用; - PyQuery使用; 3. scrapy基本使用 4. Scrapy redis实现分布式爬虫 5. 反爬措施 6. 手机APP爬虫 - 模拟器安装、fiddler、appium、mitmproxy安装; - 抓包工具的使用; - 移动端自动化控制; - 利用mitmproxy抓取存储数据; - apk脱壳反编译; references,学习资料分享 价格可谈,联系我:ddxygq。

2022-07-07

阿里巴巴java开发手册中文版

阿里巴巴java开发手册,高清原版,规范你的java开发习惯,让你的开发习惯与顶级互联网公对齐!

2018-09-02

hive-hbase-handler-1.2.1.jar

hive-hbase-handler-1.2.1.jar解决hive1.2.1,hbase不兼容情况!

2018-08-15

hadoop-2.7.2 windows7环境编译文件(winutils.exe、hadoop.dll)

windows环境下开发hadoop与本地运行,会报错,需要编译win环境hadoop工具 否则,可能会有两种错误: 1、Did not find winutils.exe: java.io.FileNotFoundException; 2、java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows 将里面的bin目录覆盖到hadoop对应bin目录即可

2018-03-07

用matlab编写猜字小游戏

用matlab编写猜字小游戏

2016-10-24

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除