1、一台“全能”的服务器
把应用系统网站、数据库、文件系统等都在一台服务器下,这样形成了最初级的服务器,一般是非常简单的应用,使用的用户量相当有限。一些企业的门户网站或刚上线使用的系统会采用这样的方式进行部署。
2、系统网站、数据库和文件系统不同的服务器进行部署
这个有先考虑的是把数据库和系统网站分离出来部署到不同的服务器。很多的系统网站很长一段时间都是把系统网站和文件服务器放在一起,把数据库分离出去后发现网站的性能没有多大的提升时,才考虑把文件系统从系统站点分离出去,减少读取文件带来了网络开销和IO读取。在配置服务是需要根据服务器所承载的职责用途分配不同性能的硬件设备,如文件服务器更需要考虑的是硬盘。
3、集群的方式进行部署
当随着业务发展和数据的不断积累,大量的数据和高并发用户的集中访问,在高性能的一台服务器也无法承受进行处理,即使是把系统网站、数据库和文件系统分离到不同的服务器中。作为web服务器是直接面向用户,所有的用户都需要从web服务器作为入口进入系统,承担着大量的用户请求,此时需要考虑的是web服务器的压力问题,一般的处理方式在web服务器前面部署负载均衡服务器调用用户请求,根据设置不同的调度策略把用户的请求分发到各个web服务器中,通常负载均衡和反向代理服务器部署在同一台服务器,到后续才会把他们分开。常见的负载均衡的硬件有F5,软件产品如HAProxy、LVS、Nginx。当然,这种情况下需要考虑的是用户的请求用可能会分发到不同的服务器中(负载均衡可以进行配置),保证不同请求间的服务端的使用状态(Session、Application、ViewState、Cache)一致性成为需要解决的问题,因此保证是系统是无状态的这个问题就不是问题了。我们要考虑Cache一致性的问题,则把Cache部署到独立的一台或多台缓存服务器中,现在流行的是Redis,也可考虑使用memerycache、AppFabric。可以参考是Docker。
与此同时,在应用层面的用户请求并发高,可以提供数据服务的数据库服务器也是不能幸免的,数据库在次时会成为瓶颈。首先考虑的是把数据库进行读写分离来改善数据库服务器的性能,通过主备功能实现数据间的同步。对数据的优化手段常用的是对数据库或表进行水平分割和垂直分割,水平分割根据数据特性分,垂直分割根据业务属性进行分。还有一种方式对表库进行分割的方式,散列与水平分割相似,但没有水平分割那样的明显分割界限,采用Hash算法把数据分散到各个分表中, 这样IO更加均衡。一般来说,我们会按照业务或者功能模块将数据库进行分离,不同的模块对应不同的数据库或者表,再按照一定的策略对某个页面或者功能进行更小的数据库散列,比如用户表,按照用户ID进行表散列,散列n张表,并且以后对表会进行增加,这里是Hash的分表库的算法是关键步骤。需要权衡性能与数据使用分布式事物保证数据的一致性,应能够低成本的提升系统的性能并且有很好的扩展性,同时需要考虑分表库的算法评估,减少使用数据带来的开销。常见的表分区是水平切割的一种体现。
在文件系统中,需要考虑目录下面的文件数量,避免因为检索的文件过多带来的性能问题。对应于文件夹的命名规则尽可能的与业务规则相关,如果实在不行则考虑系统时间或自定义的命名规范。如果单个文件服务器不能满足当前系统的需求,则考虑分布式的文件系统进行支撑,如NFS、MS(DFS)。
上面的集中式部署,如果系统可以分布在各个地区或区域,则可以考虑分布式部署,不同的地区地域各部署一套系统,定义一个时间点把数据同步到主服务器中,在通过主服务器分发到各个地区服务器,各地区的系统相当于一个中转站。
4、根据业务拆分成多个应用服务器,web服务与应用进行分离
一般Web服务和应用都会部署在同一台服务器上,此时则需要把应用从web服务器中独立出来,并且根据业务模块把各个应用部署到不同的服务器中,如数据查询应用、用户管理应用、报表管理应用等。web服务器只处理用户请求和用户数据交互的呈现,应用服务器处理业务逻辑处理和数据读写。应用分布到多个服务器中遵循的规则是每个应用可以承担起相当独立的运作,减少相互间的依赖。不同应用间的通讯可以使用消息队列(MQ)的方式实现,也可以是SOA服务、微服务的方式提供。数据库也可以按照此方式进行拆分。同时把web服务器中的所有js、CSS、image都分离出来部署到静态文件服务器中。
5、海量数据的查询
数据的不断积累,到了海量数据时,则会造成数据集查询的性能瓶颈。通常使用的方式是nosql数据库和搜索引擎来解决查询的问题。系统的数据不是一定要使用我们常规的方式放到关系型数据库中,把一下常使用查询的数据或数据库的索引数据放到nosql中。现在使用比较多的是Redis和Mongodb,搜索引擎有lucene和支持.net版本的lucene.net。也有基于lucene内核实现的Solr、ElasticSearch等搜索引擎,这些都可支持集群的方式部署。
6、系统之间的交互
随着业务的不断深入和拓展,会出现系统群的存在,而系统系统之间的通讯和数据交互也会频繁的进行,在此时就会出现服务层。服务层是为各个客户端(调用方)提供数据服务,在应用层之上。.net一般服务器层使用的是WCF、WebService和Restful方式的WebAPI,数据传输实体一般都定义成DTO。在我们服务器设计层面上更多的考虑保证数据事务的一致性,例如事务补偿的机制。对每个服务器记录在特定时间段中负荷、资源使用情况、访问量和连接数等参数数据,随时可以掌握每台服务器的运行情况,根据每个业务模块的服务器使用情况进行调度,保证所有的服务器的压力达到相对的均衡。
7、CDN和数据仓库
CDN需要考虑两个方面的内容存储问题,一个是内容源的集中存储,另一个是内容在Cache节点中的分布式存储。它借助于建立索引、缓存、流分裂、组播(Multicast)等技术,将内容发布或投递到距离用户最近的远程服务点(POP)处。整体性的网络负载均衡技术,通过内容路由器中的重定向(DNS)机制,在多个远程POP上均衡用户的请求,以使用户请求得到最近内容源的响应。根据内容的可用性、服务器的可用性以及用户的背景,在POP的缓存服务器上,利用应用层交换、流分裂、重定向(ICP、WCCP)等技术,智能地平衡负载流量。通过内部和外部监控系统,获取网络部件的状况信息,测量内容发布的端到端性能(如包丢失、延时、平均带宽、启动时间、帧速率等),保证网络处于最佳的运行状态。可以搭建几个中心,中心之间的数据需要保持同步。
数据库仓库的数据可用通过ETL/ELT将数据定期的从生产环境数据库导入数据。大型的系统主要是使用按列存储、并行数据库的方式。
8、云
一般企业可以考虑使用云来部署系统,现在比较流行的是Azure、阿里云、亚马逊等多会提供服务,如阿里云,ECS提供虚拟服务器、SLB提供负载均衡、RDS提供数据库服务、OSS提供存储服务、DRDS提供分布式数据服务MaxCompute提供大数据服务、RocketMQ提供MQ、OCS提供分布式缓存服务,还有很多的服务。这样企业可以根据自身的情况可以购买对应的服务,从而节省成本。
对应数据库层面性能优化的,可以了解一下Hadoop、Spark、ZooKeeper、Dubbo,但这些在.net应用比较麻烦。