SQL(结构化查询语言)是针对结构化数据设计的,而Hadoop最初的许多应用针对的是文本这种非结构化数据。
主要区别如下:
- 用向外扩展代替向上扩展
Hadoop集群就是增加更多的机器。一个Hadoop集群的标配是十至数百台计算机。而不是专注于提高单台服务器的性能
- 用键/值对代替关系表
SQL 针对结构化查询语句 是结构化数据,hadoop针对的是非结构化数据,文本形式
关系数据库是 有一定格式,而存放文本、图片和xml文件 则应该用键值对的方式
- 用函数式编程(MapReduce)代替声明式查询(SQL)
hadoop读取出的数据,可以建立复杂的模型或者改变图片格式
- 用离线批量处理代替在线处理
Hadoop是专为离线处理和大规模数据分析而设计的,它并不适合那种对几个记录随机读写的在线事务处理模式。
想了解或者学习的小伙伴可以多多关注 想获取资料的可以加QQ群863529330