[20]Basic
文章平均质量分 75
hjw199089
从事大数据
(1)查询引擎开发-presto深度开发-hive开发-自研查询引擎开发
(2)大数据用户行为分析
(3)spark、sparkstreaming、storm、druid开发应用经验
(4)数据仓库开发
展开
-
数据库范式
1 第一范式(1NF)第一范式就是无重复的列。即实体中的某个属性不能有多个值或者不能有重复的属性2 第二范式(2NF)第二范式就是非主属性非部分依赖于主关键字要求数据库表中的每个实例或行必须可以被唯一地区分。为实现区分通常需要为表加上一个列,以存储各个实例的唯一标识3 第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。A表原创 2017-09-09 21:12:44 · 185 阅读 · 0 评论 -
数据分析与软件
参考学习《Druid实时大数据分析》【数据分析】数据分析:数据收集-->处理(格式转化、清洗)-->建模-->分析-->可视化,将数据转化为价值信息的过程。领域商务智能(Business Intelligence,BI)数据挖掘(Data Mining,DM)联机分析处理(On-Line Analytical Processing,OLAP)人工智能(Artificial翻译 2017-09-10 21:55:49 · 1432 阅读 · 0 评论 -
RDBMS与数据分析方法
【RDBMS】RDBMS即关系数据库管理系统(Relational Database Management System),是将数据组织为相关的行和列的系统RDBMS 中的数据存储在被称为表(tables)的数据库对象中。表是相关的数据项的集合,它由列和行组成RDBMS的特点:1.数据以表格的形式出现2.每行为各种记录名称3.每列为记录名称所对应的数据域4.许多原创 2017-09-10 15:29:27 · 532 阅读 · 0 评论 -
OLAP基础笔记
OLAP(Online Analytical Processing)联机分析处理OLAP,它具有FASMI(Fast Analysisof Shared Multidimensional Information),即共享多维信息的快速分析的特征。OLAP委员会对联机分析处理的定义:使分析人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、原创 2017-09-09 21:33:41 · 823 阅读 · 0 评论 -
1-Druid 概览
MataMarkets在2012年开源Druid,定位为分布式,支持实时分析的数据存储系统类似于传统的OLPA,但做了一些取舍和强化,像时序数据库,按照时间粒度聚合,加快分析设计原则[1]快速查询(部分聚合、内存+索引)[2]水平扩展[3]实时分析翻译 2017-09-10 16:23:22 · 351 阅读 · 0 评论 -
Java 远程调试
Java 远程调试转载 2018-11-12 15:11:30 · 195 阅读 · 0 评论