一篇文章让你读懂SQL数据库和Hadoop

SQL(结构化查询语言)是针对结构化数据设计的,而Hadoop最初的许多应用针对的是文本这种非结构化数据。

主要区别如下:

  1. 用向外扩展代替向上扩展

Hadoop集群就是增加更多的机器。一个Hadoop集群的标配是十至数百台计算机。而不是专注于提高单台服务器的性能

  1. 用键/值对代替关系表

SQL 针对结构化查询语句 是结构化数据,hadoop针对的是非结构化数据,文本形式

关系数据库是 有一定格式,而存放文本、图片和xml文件 则应该用键值对的方式

  1. 用函数式编程(MapReduce)代替声明式查询(SQL)

hadoop读取出的数据,可以建立复杂的模型或者改变图片格式

  1. 用离线批量处理代替在线处理

Hadoop是专为离线处理和大规模数据分析而设计的,它并不适合那种对几个记录随机读写的在线事务处理模式。
想了解或者学习的小伙伴可以多多关注 想获取资料的可以加QQ群863529330

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值