- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 2020-09-09
三范式的定义第一范式(1NF):强调的是列的原子性,即列不能够再分成其他几列。第二范式(2NF):首先是 1NF,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。第三范式(3NF):首先是 2NF,另外非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在:非主键列 A 依赖于非主键列 B,非主键列 B 依赖于主键的情况。...
2020-09-09 09:33:48 88
原创 数据库设计与数据仓库设计区别
数据库设计与数据仓库设计区别 针对数据库设计一般用的是三范式。因为数据库的数据会用于频繁的增删改查,因此出于减少系统压力考虑,会尽量减少冗余,从而提升系统频繁读写数据的效率。而星型、雪花型则是数据仓库的设计模式。与数据库的使用目的不同,数据仓库更多的是存储历史数据,不会有频繁的读写。其主要是用于从历史数据中进行分析,进而获取指导性的生产指引,生成报表等等。而这时数据库设计中的范式拆表以提升效率的方法这时却会适得其反(因为历史数据的量相当庞大,而往往数据分析、BI等又需要从多个表中检索数据来进行,这时大表
2020-09-09 09:32:32 617
原创 python实现随机生成json格式的日志数据
要生成的日志格式为:“”"#事件“action”: “1”, #动作:开始加载=1,加载成功=2,加载失败=3“loading_time”: “2020-06-10 10:11:10”, #加载时间“loading_way”:“1”, #加载类型:1-读取缓存,2-从接口拉新数据“extend1”:"", #扩展字段 Extend1“extend2”:"", #扩展字段 Extend2“type”:“1”, #加载类型:自动加载=1,用户下拽加
2020-06-10 13:59:24 861
原创 hive的order by ,sort by ,distribute by 和 cluster by
order by : 全局排序,一个reduce中完成sort by : 分区排序,多个reduce中分别完成distribute by : 将相同字段的map输出分发到一个reduce节点上做处理cluster by :合并sort by 和distribute by 功能。
2020-05-21 14:36:59 126
原创 SDK和API的区别
SDK可以想象成一个虚拟的程序包,在这个程序包中有一份做好的软件功能,这份程序包几乎是全封闭的,只有一个小小接口可以联通外界,这个接口就是API。
2020-05-21 10:57:50 182
转载 Windows下PATH,CLASSPATH等环境变量详解
Windows下PATH,CLASSPATH等环境变量详解转载自:https://blog.csdn.net/wf131410000/article/details/72618752
2020-05-21 10:47:59 144
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人