文章目录
-
企业办公网络:指的是享受服务的网络
-
企业数据中心网络:指的是为用户提供服务的网络
这里主要讲述提供服务的网络
一:从无到有——网络集成,新建网络
国内集成商:系统+集成
系统:网络、数据库、主机(网络资源、存储资源、计算资源)
备注:硬件方面的
计算资源————服务器
网络资源————网络设备、网线、光纤
存储资源————存储设备
1.1 案例
比如访问百度的资源,就需要涉及到网络资源(搜索引擎)、存储资源(数据存储)、计算资源(整理你可能需要的数据)
1.2 集成
甲方不想搞,把业务外包出去,甲方要找系统集成商
系统集成商:华为系统集成商、亚信科技(用户多是运营商)、华讯(用户多是金融、政府)
集成商被视为乙方,千人以上的系统集成商内工作可以锻炼人,接触到不少东西
1.3 网络架构评判标准
- 可用性
网络设备不会出现故障、出现故障的概率低
- 可靠性
网络设备冗余
一层————物理层:设备冗余——堆叠
二层————数据链路层:链路捆绑——两条及以上逻辑组成一条链路
STP——逻辑阻断接口
三层————网络层:HSRP(思科私有)、VRRP(通用)、GLBP(思科私有)、VGMP(华为私有)
四层————传输层:负载均衡
七层————应用层:负载均衡
- 安全性
支付型公司注意端口攻击、ACL、防火墙
- 速度
网络的传输速度快,用户体验度好
- 成本
根据业务需要购买带宽——对等
比如家用的100M宽带,下载100M,上传4M,就是不对等
- 后期扩展性
预留网络扩展接口,10G,4G,2G, 根据28原则分配
乙方包了甲方的活
乙方把活拆出来,包给第三方
第三方,去甲方干活
乙方,提供方案,第三方是干活
二:从有到强————网络运维
当从无到有,网络架构已经成形了,企业单位便会招相关的运维人员,做网络维护,保证网络正常工作
运维的意义:运维并不是仅仅看着让网络不出问题
还有优化网络、网络故障排查的思路
2.1 优化网络
设备的老化,业务的发展不断完善
2.2 网络故障排查
当网络出现问题的时候,需要一套排障的思路————需要时间积累
2.3 如何衡量网络质量的好坏
三个方面
- 丢包
- 延时
- 抖动
2.3.1 丢包
丢包分两种
网络中断,丢包率百分之百
丢包率小于百分之百
判断一个网络是否中断(丢包)
使用pin工具
例如:
ping www.baidu.com
tracert(windows)/traceroute(linux)————跟踪网络中的路径
tracert -d www.baidu.com
选项:
-d 不将地址解析成主机名。
-h maximum_hops 搜索目标的最大跃点数。
-j host-list 与主机列表一起的松散源路由(仅适用于 IPv4)。
-w timeout 等待每个回复的超时时间(以毫秒为单位)。
-R 跟踪往返行程路径(仅适用于 IPv6)。
-S srcaddr 要使用的源地址(仅适用于 IPv6)。
-4 强制使用 IPv4。
-6 强制使用 IPv6。
可能中间有防火墙,被过滤掉
通过最多30个跃点跟踪
记录序号从1开始,每个记录就是一跳,每跳就表示一个网关,我们看到每行有三个时间,单位是ms,其实就是-q的默认参数。探测数据包向每个网关发送三个数据包后,网关响应后返回时间,如果指定-q 4,表示向每个网关发送4个数据包
有时我们traceroute一台主机时,会看到有一些行是以*表示的,出现这样的情况,可能是防火墙封掉了ICMP的返回信息,所以得不到相关的数据包返回的数据
有时我们在某一网关处延时比较长,有可能是某台网关比较阻塞,也可能是物理设备本身的原因。当然,如果某台DNS出现问题时,不能解析主机名、域名,也会有延时长的现象,可以-n 指定避免dns解析,以IP格式输出数据
如果在局域网中的不同网段之间,我们可以通过traceroute来排查问题所在,是主机的问题还是网关的问题
如果我们通过远程来访问某台服务器遇到问题时,使用traceroute追踪数据包所经过的网关,将出现问题的节点提交给IDC服务商,可以帮助我们解决问题
tracert/traceroute 这个办法只能判断网络中断在哪个地方
如果是丢包,就要使用linux中的MTR工具,来判断在哪个地方丢的包
[root@ceph00 ~]# yum install mtr -y
[root@ceph00 ~]# mtr www.baidu.com
在最后一行看到的丢包率是0%,说明网络质量是好的
总结:当网络出现故障时(丢包或是中断)
办法一:使用ping探测网络是中断还是丢包
如果是中断,使用tracert/traceroute 去判断中断在什么地方,然后到该节点去开启相应端口
如果是丢包,使用mtr判断丢包的位置
中断容易排查——网线端口down
丢包难以排查——端口解除不良,中间未知节点阻止放行,造成丢包的现象有很多
延时:语音网络,开视频会议直播,会有延时
抖动——每个数据包的延时若是固定的话,不会影响体验;当每个数据包的延时不是固定的,便会造成抖动
3.4 网络故障定位
- 人为故障————错误增删改、命令不熟悉
物理操作:增改拔线路
命令操作:增删除vlan、stp
错增删路由、动态路由协议过滤路由条目等——子路由条目
错误增防火墙安全策略
错误的nat转换
做了限制QOS时配置错误(流量限速)
负载均衡产品错误增加策略
- 无人为运行故障
企业办公网络问题——了解企业数据中心问题如何解决,企业办公网络问题会变得很简单
企业数据中心问题——判断企业的业务问题是否和网络有关
极个别的业务故障:1-2台业务出现问题,与网络关系不大,没但是不能排除与网络没有关系
排查思路:
有日志服务器:查看日志服务器,查看交换机是否有问题,查看交换机的接口是否有问题
无日志服务器:通过服务器的mac地址查看在哪个交换机接口上(最好做个网络监控),然后判断链路是否有问题
小面积业务故障(与网络相关的故障点)
与接入交换机有关系
大面积业务故障(与网络相关的故障点)
与核心交换机有关系
丢包问题:
1.主机资源耗尽————CPU/memory资源使用100%、webserver连接数满、服务器接口流量满
2.网络资源耗尽————交换机CU使用率100%(二层、三层不一样)、交换机流量打满、交换机关闭STP导致环路、防火墙会话数打满、防火墙nat TCP转换端口被耗尽(65535)
3.数据包来回路径不一致——一般这种问题在刚开始配置时就应该出现问题;在运维中出现这个问题可能是设备断电或者重启导致某些配置丢失
4.设备版本问题——需要升级
ping ip 地址能用
pingDNS不通
dns网络问题
dns自身配置问题
ping 通,telnet不同
可能中间链路将端口给过滤了
telnet www.baidu.com 443 会话能通
如何判断哪个策略有问题
traceroute -p 443 www.baidu.com 判断哪个地方不同
ping telnet 通, TCP传递数据不同
一般和链路数据MTU有关系
某些业务传递的数据是大于1500的,但是端口的上限设置时1470,这会造成部分数据丢失(端口不能分片)
telnet ip(域名) 端口号 判断对方有没有启动业务端口
业务端口有没有起来,服务器有没有启动
路由层面ACL规则,端口有没有被封掉
防火墙规则:低到高,端口有没有放通