前情提要:我新到一个公司,这个代码之前是外包出去的,现在由我继续开发,然后新买了一台服务器,老服务器就跑的外包项目,新服务器上就跑的我接着开发的,在新服务器上就出现了socket接收数据丢包严重的情况,但是都是局域网传的,甚至就是那台服务器的socket发出的数据都丢包严重。然后我就对比代码,发现那段代码一点都没改,然后把老服务器的代码拿过来也变慢了,这就尴尬了。所以我把这个问题简称为由于服务器性能太好引起的bug。
现在开始说问题:后来看数据处理那个类,发现处理的时候没有判断数据流里数据长度够不够就取了,也就是第一次取的时候有可能只取了一部分,然后第二次取的时候,把第一次剩下的内容当成头部取了,所以就一直错下去了,但是发送频率很高,所以偶尔又能收到一条。
现在解释为什么在老服务器上没问题:其实就是老服务性能不行,在取数据的时候,完整的包已经发过来了,所以不会存在只取到一部分的问题,但是新服务器性能比较好,在取数据的时候,被操作系统拆了的包,只发了一部分过来,就开始取数据了,所以就出问题了。
解决方案:1、简单粗暴的就是在取数据之前让线程休息一会儿,保证操作系统把完整的包都发过来了;虽然这个能解决问题,但是不太合适;2、在取数据之前判断一下流里的数据长度够内容长度再取,或者用datainputstream的readfully方法,就是读的时候保证有参数byte[]长度的数据才取数据,不然就阻塞,也就是休息会儿,只有长度够了,就开始取数据了。