- 博客(9)
- 资源 (5)
- 收藏
- 关注
原创 【Python】pyecharts 介绍
ECharts,一个使用 JavaScript 实现的开源可视化库,可以流畅的运行在 PC 和移动设备上,兼容当前绝大部分浏览器(IE8/9/10/11,Chrome,Firefox,Safari等),底层依赖轻量级的矢量图形库 ZRender,提供直观,交互丰富,可高度个性化定制的数据可视化图表。 Echarts 百度开源可视化工具http...
2020-04-18 21:18:06 9059 1
原创 【容器化】Docker 容器入门(简介、安装、镜像和容器的命令使用)
一、Docker简介1.1 什么是虚拟化1.2 什么是Docker1.3 容器与虚拟机比较1.4 Docker 组件1.4.1 Docker服务器与客户端1.4.2 Docker镜像与容器1.4.3 Registry(注册中心)二、Docker安装与启动2.1 安装Docker2.2 设置ustc的镜像2.3 Docker的启动与停止三、常用命令...
2020-04-12 15:06:27 1364 2
原创 【Haoop】Yarn(RM-AM-NM 三大组件的通信,任务提交搭到 Yarn 的过程,文件切片)
NodeManager是每个节点上的资源和任务管理器,它是管理这台机器的代理,负责该节点程序的运行,以及该节点资源的管理和监控。(2) AsM一般会返回一个新生成的全局ID,除此之外,传递的信息还有集群的资源状况,这样Client就可以在需要时请求资源来运行任务的第一个 container 即 AM。在上面(5)与(6)之间,AM在收到RM返回的container列表后,会与每个container所在机器的NM通信,来启动这个container,下面就说说这个过程。这个过程是AM向RM请求资源。
2020-04-11 16:56:41 6424 1
原创 【Hive】Join的 MR 底层原理
Hive Map Join如果不指定MapJoin或者不符合MapJoin的条件,那么Hive解析器会将Join操作转换成Common Join,即:在Reduce阶段完成join.整个过程包含Map、Shuffle、Reduce阶段。读取源表的数据,Map输出时候以 Join on 条件中的列为key,如果Join有多个关联键,则以这些关联键的组合作为key;Map输出的 value 为 join 之后所关心的(select或者where中需要用到的)列...
2020-04-10 16:17:33 4991 1
原创 【分布式数据库】Phoenix安装、入门案例
目录一、Phoenix简介1、什么是Phoenix2、Phoenix性能二、Phoenix的安装部署三、Phoenix入门案例四、建立与HBase表映射五、使用Phoenix构建二级索引加快查询效率1、配置HBase支持Phoenix二级索引2、重启HBase集群使配置生效一、Phoenix简介1、什么是PhoenixPhoenix是一个HBa...
2020-04-06 23:33:57 1011
原创 Kylin 学习笔记(二)-----Kylin增量构建入门、Cube碎片管理、JDBC连接、Cube简单优化
目录一、Kylin增量构建1、应用场景2、理解Cube、Cuboid与Segment的关系3、全量构建与增量构建全量构建4、增量构建Cube过程5、增量Cube的 创建-案例Kylin操作步骤二、Cube碎片管理1、增量构建的问题2、管理Cube碎片3、手动触发合并Segment3、删除Segment4、自动合并5、配置保留Segment...
2020-04-06 11:03:29 1709 2
原创 【分布式数据库】HBase概念介绍及典型案例分析
本次分享的内容主要分为以下五点:HBase基本知识; HBase读写流程; RowKey设计要点; HBase生态介绍; HBase典型案例分析。首先我们简单介绍一下 HBase 是什么。HBase 最开始是受 Google 的 BigTable 启发而开发的分布式、多版本、面向列的开源数据库。其主要特点是支持上亿行、百万列,支持强一致性、并且具有高扩展、...
2020-04-05 14:23:09 3451 1
原创 Kyin学习笔记(一)-----Kylin安装、入门案例和原理介绍
一、Kylin简介1、Kylin的诞生背景ebay-中国团队研发的,是第一个真正由中国人自己主导、从零开始、自主研发、并成为Apache顶级开源项目 Hive的性能比较慢,支持SQL灵活查询,特别慢 HBase的性能快,原生不支持SQL Kylin是将先将数据进行预处理,将预处理的结果放在HBase中。效率很高2、Kylin的应用场景Kylin 典型的应用场景如下:用...
2020-04-05 12:28:28 1393
原创 SparkSQL核心笔记(一)----DataSet 和 DataFrame 剖析
Spark SQL使用Hive解析SQL生成AST语法树, 将其后的逻辑计划生成, 优化, 物理计划都自己完成, 而不依赖Hive执行计划和优化交给优化器Catalyst内建了一套简单的SQL解析器, 可以不使用HQL, 此外, 还引入和DataFrame这样的DSL API, 完全可以不依赖任何Hive的组件Shark只能查询文件,Spark SQL可以直接将查询作用于RDD, 这一点是一个大进步
2020-04-04 00:55:23 1846
python基础语法入门
2024-05-01
HBase数据库性能调优
2024-05-01
2024 Redis面试宝典
2024-05-01
全国计算机二级十套历年真题
2024-04-30
Java最新大厂面试宝典
2023-10-11
程序猿面试简历模板精选
2023-10-10
dbeaver-ce-6.3.1-win32.win32.x86_64.zip
2020-02-14
SublimeText3_Build3083_x64_XiaZaiBa.zip
2019-08-15
eclipse-jee-2018-09-win32-x86-64.zip
2019-08-12
npp.6.9.2.Installer.zip
2019-08-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人