1.扩展性
纵向扩展:
表示在需要处理更多负载时通过提高单个系统处理能力的方法来解决问题。最简单的情况就是为应用系统提供更为强大的硬件。
横向扩展:
是将服务分割为众多的子服务并在负载平衡等技术的帮助下在应用中添加新的服务实例
理解连想:
纵向扩展:
现在给一个农民分五亩地,一只小牛犊正好可以犁完,但是有给这个农民分了五亩地,一共十亩地,超出了一只小牛犊的工作量,那么农民就换了一头小牛,刚刚好能完成十亩地的量,但是如果有给了十亩地给他,则他就要换一只大牛来去完成........以此类推,每次都去跟换更好的设备去完成任务。
横向扩展:
现在给一个农民分五亩地,一只小牛犊正好可以犁完,但是有给这个农民分了五亩地,一共十亩地,超出了一只小牛犊的工作量,那么农民就去有买了一只小牛犊,刚刚好,两头小牛犊去完成,又给十亩地,在买两头小牛犊就又可以完成.........以此类推,每次都去累加原有设备去完成任务
大数据快在于:纵向扩展——》一头老牛去犁完二十亩地(20小时)
横向扩展——》四头小牛犊去犁完二十亩地(20/4=5小时)
2.分布式
资源集中(计算与存储)
集中式计算
数据计算几乎完全依赖于一台中、大型的中心计算机的处理能力。和它相连的终端(用户设备)具有各不相同的智能程度。实际上大多数终端完全不具有处理能力,仅仅作为一台输入输出设备使用。
集中式存储
指建立一个庞大的数据库,把各种信息存入其中,各种功能模块围绕信息库的周围并对信息库进行录入、修改、查询、删除等操作的组织方式。
资源分布(计算与存储)
分布式计算
是一种计算方法,是将该应用分解成许多小的部分,分配给多台计算机进行处理。这样可以节约整体计算时间,大大提高计算效率。
分布式存储
是一种计算方法,是将该应用分解成许多小的部分,分配给多台计算机进行处理。这样可以节约整体计算时间,大大提高计算效率。
事例讲解:
现在有1T的文件,但是要给它存储到服务器
集中式存储:1T的文件由一个io进行写入存储
分布式存储:1T文件分为好几个部分,一个部分存储到一个小的服务器,多个io同时进行存储1T文件的一小部分
一个磁头去写入一个文跟多个磁头去共同书写一个文件,可想而知,哪个更快!!!
(计算同理)
3.可用性
单份数据:
用户存储数据去服务器,最多会只做一个备份
数据复制:
用户存储数据去服务器,服务器会自动的分多个节点去存储这份数据的一部分,而且会存储多份
4.模型
移动数据:
移动数据到程序端,一般的数据量小则以T为单位,大的以P为单位,数据量大,传输耗时慢!!!
移动计算程序
计算程序写完必后会自动复制多分到存储数据的各个节点,进行计算,所传输的就只有几k的数据 大的也就几M的数据,速度快!!!