networks
文章平均质量分 79
__Silent
这个作者很懒,什么都没留下…
展开
-
VxLAN实验 -- 相同网段的网络通信
目的基于VxLAN,实现同一网段下,跨主机节点的网络通信实验环境三台虚拟机192.168.1.59/24 、 192.168.1.183/24 、192.168.1.192/24相关脚本创建一个VxLAN的环境 net.sh#!/bin/shbrctl addbr br-zouip link add zouveth0 type ve...原创 2018-08-20 18:00:53 · 2343 阅读 · 0 评论 -
VxLAN 实验 -- 不同网段的网络通信
目的基于VxLAN,实现不同网段下,跨主机节点的网络通信实验环境两台虚拟机192.168.1.183/24、 192.168.1.59/24 操作配置 192.168.1.183/241. bash net.sh#!/bin/shbrctl addbr br-zouip link add zouveth0 type veth pe...原创 2018-08-21 09:20:31 · 2667 阅读 · 1 评论 -
Big Packet lose in K8s (一)
环境K8s v1.10.2Docker 1.13.1flannel image v0.9.11 master + 2 work nodes1. 问题表现访问在该环境中运行的grafana页面,发现4个GET请求中有一个timeout failed 2. 问题定位过程2.1. K8s + flannel 网络结构&报文流转分析 定位之前,...原创 2018-08-29 19:12:32 · 304 阅读 · 0 评论 -
Big Packet lose in K8s (二)
新的征程在第一篇定位 K8s环境中打包丢失的问题的时候,我们定位到 eth0收到了No.9 报文,但是 flannel.1 中丢失了No.9 报文。 那么在 eth0 到 flannel.1 之间,到底经过了什么处理,为什么丢包了呢?因为我们配置K8s的 nodeport service 将外部30063端口 转换为 内部 3000端口,而service 的功能是由iptables...原创 2018-08-29 19:20:07 · 503 阅读 · 0 评论 -
Big Packet lose in K8s (三) - Simulate the Packets lost issue on the K8s environment by manual
在虚拟化的环境中手工模拟丢包问题进一步明确该问题是一个纯粹的网络问题,而与K8s、Docker、flannel都没有关系环境宿主机: 10.10.88.128虚拟机: 10.10.88.118/24客户端物理机:10.10.88.2复现步骤在虚拟机中建立网络环境test.sh: #!/bin/shbrctl addbr docker0...原创 2018-08-29 19:21:34 · 295 阅读 · 0 评论 -
1) UDP Packet Lost - receive buffer errors
最近公司项目遇到一个 UDP丢包问题,导致数据库有一些异常。 在经历了几天加几个夜晚的分析定位,总算将问题解决,特写下总结、分析的文章,以供追溯一. UDP Receive Packet 过程首先网络报文通过物理网线发送到网卡网络驱动程序会把网络中的报文读出来放到 ring buffer 中,这个过程使用 DMA(Direct Memory Access),不需要 CP...原创 2018-08-29 19:53:15 · 6474 阅读 · 0 评论 -
2) UDP Packet Lost - packet reassembles failed
之前有分析 receive buffer errors,在公司的项目中同时还遇到了 packet reassembles failed报错,在该篇文章中将对该问题进行分析一. Packet reassemble当发送的UDP报文长度大于MTU大小时,IP层会将报文进行分片当接收端收到分片后,会进行分片重组,生成一个完整的UDP报文分片重组的过程由内核协议栈完成的,协议...原创 2018-08-29 19:56:30 · 3516 阅读 · 0 评论 -
(1) S3 connect reset by peer
问题描述 && 初步分析定位问题描述s3cmd -q get s3://zh_test/data_30.tar - | tar -xvf - -C ./在使用上面的命令,从S3中get 一个tar包,并同时解压到本地ECFS分布式存储的卷中时,会发生报错,导致get中断。问题复现频率非常高s3cmd 日志#s3cmd -q get s3://zh_test...原创 2018-09-17 18:51:20 · 1025 阅读 · 0 评论 -
(2) S3 connect reset by peer
Connect reset 原因 定位分析1. 问题表现继第一篇《问题描述 & 初步分析定位》, 问题表现为:s3cmd error message: error: [Errno 104] Connection reset by peerradosgw error message: ERROR: flush_read_list(): d->client_cb->...原创 2018-09-17 18:54:13 · 1397 阅读 · 0 评论