sql拓展
sql与hive、与JAVA、与python的关系
数据库拓展
数据分SQL、NOSQL
-
SQL就是结构化数据,如关系型数据库
特点:存在关系模型,有清晰的结构划分
数据化查询数据规模有限、增长速度有预期 -
NOSQL 包括半结构化数据、非结构化数据
2.1 半结构化数据,包括EMAIL、XML文件
特点:非关系模型,有基本固定结构模式
解释:EMAIL有收件地址、收件人发件地址、发件人这些是固定的,但是内容是不固定的
2.2 非结构化数据,包括WORD、PPT、图片
特点:没有固定模式,采用内容管理
对NOSQL数据对结构化查询的支持比较差,而且海量数据增长速度难以预期,但是要挖掘信息还是需要这种海量的信息支持