sql拓展
sql与hive、与JAVA、与python的关系
数据库拓展
数据分SQL、NOSQL
-
SQL就是结构化数据,如关系型数据库
特点:存在关系模型,有清晰的结构划分
数据化查询数据规模有限、增长速度有预期 -
NOSQL 包括半结构化数据、非结构化数据
2.1 半结构化数据,包括EMAIL、XML文件
特点:非关系模型,有基本固定结构模式
解释:EMAIL有收件地址、收件人发件地址、发件人这些是固定的,但是内容是不固定的
2.2 非结构化数据,包括WORD、PPT、图片
特点:没有固定模式,采用内容管理
对NOSQL数据对结构化查询的支持比较差,而且海量数据增长速度难以预期,但是要挖掘信息还是需要这种海量的信息支持
数据库拓展–HIVE
HIVE是数据系统仓库工具
HIVE能做的事情:比假设一个公司有五个系统,每个系统都有操作型数据(比如在系统中进行了某项操作,那么就会有一条操作型数据的记录),HI