爬虫实战6—分布式系统设计

本文探讨了分布式系统的基本概念,强调了其高容错性、可靠性和可扩展性的优势,同时指出设计初期不必急于实现分布式。接着详细讲解了主从服务结构在分布式爬虫系统中的应用,包括Master-Slave架构、心跳检测机制以及Remote Procedure Calls和Socket通信。最后提到了串行化处理在任务队列管理中的作用,以保护数据免受过度访问。
摘要由CSDN通过智能技术生成

文章说明:本文是在学习一个网络爬虫课程时所做笔记,文章如有不对的地方,欢迎指出,积极讨论。

一、分布式系统

分布式系统(distributed system):是建立在网络之上的软件系统,具有高度的内聚性和透明性。网络和分布式系统之间的区别更多的在于高层软件(特别是OS),而不是硬件。内聚性是指每一个数据库分布节点高度自治,有本地的数据库管理系统。透明性是指每一个数据库分布节点对用户的应用来说都是透明的,看不出是本地还是远程。在分布式数据库系统,用户感觉不到数据是分布的,即用户不须知道是否分割、有无副本、数据存于哪个站点以及事务在哪个站点上执行等。

软件系统(software systems):是指由系统软件、支撑软件和应用软件组成的计算机软件系统,它是计算机系统中有软件组成的部分。

分布式处理(distributedprocessing)和并行处理(Parallel processing)是为了提高并行处理速度采用的两种不同的体系架构。并行处理是利用多个功能部件或多个处理机同时工作来提高系统性能或可靠性的计算机系统,这种系统至少包含指令级或指令级以上的并行。分布式处理则是将不同地点的,或具有不同功能的,或拥有不同数据的多台计算机通过通信网络连接起来,在控制系统的统一管理控制下,协调地完成大规模信息处理任务的计算机系统。

处理机(processor):包括CPU、主存储器和I/O接口。处理机外接外围设备就构成完整的计算机系统。

(一)Deduce ofdistributed system

(1)A program:is the codeyou write.

(2)A process:is what youget when you run it.

(3)A message:is used tocommunicate betwee

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值