本人从事TCP的socket编程多年,趟过很多坑,对于TCP是“全双工的字节流”这几个字的含义有深刻理解。这几个字,文字虽少,但字字精辟。如果没有深刻理解,编程中可能知其然不知其所以然,难有大作为。“全双工的字节流”详解如下:
(1) 全双工:意味着,TCP的收发是可以同时进行的。亦即接收的时候可以发送,发送的时候也可以接收,两者互不冲突,可同时进行。
而OpenSSL则不同,OpenSSL是单工的,亦即收和发不能同时进行,同一时刻只能其中之一进行,也就意味着,OpenSSL的收和发之间必须要加锁互斥,两者不能同时工作。理解了这一点,就很容易明白,OpenSSL的性能必然是低下的,即使不考虑加密带来的损失,理论上也应比普通的socket性能至少低50%,这一工作原理是很重要的原因。
(2) 字节:意味着,无论物理层或链路层收到的数据是否为一个个二进制位的数据,在TCP层接收到的数据一定是一个个字节。也就是说,我们在进行socket编程时,只需要考虑接收一个个字节,而不是一个个位的数据。
(3) 流:意味着,socket的数据无头无尾,就像流水一样,如果从中间任意位置起,你无法知道一个消息包确切的开始或结束位置,除非从TCP的头开始算起。
① 也就是意味着,我们在应用层编程时,必须定义一个应用层的包头,从收到的第一个字节开始,通过该包头能确定一个包的长度,然后根据包的长度,确定一个个包的起止位置。这也就是我们看到所有的TCP的socket编程中,都需要定义一个包头,并在其中可以获得应用层包的总长度的原因。
② 同时也意味着,数据流不是一个个应用层的数据包,对于接收,可能收到的是一个完整的数据包,也可能了收到1/3个数据包,也可能收到4/5个数据包,或者一个完整的数据包,也可能收到1.5个或3.2个数据包,这是不确定的。需要自己在编程中,自己解析确定收到的是否完整的数据包,如果不足,需要继续接收;如果多余,需要分拆成多个包。
要做一个专业的socket程序的难度还是非常高的,必须有相当多的积累才可能编出质量过硬的软件。如果大家觉得难度过大,或者时间精力不足以从头开始编码,建议使用第三方的socket封装库来实现,专业的事情留给专业的人来做,站在巨人的肩膀上,质量更有保证,比起招聘一个程序员或团队研究2至3年还不一定能出成果相比,使用第三方socket封装库质量可靠得多。比如waisock就是一个非常优秀的socket封装库,该项目在知名公司的多个大型项目中使用过,经过了反复的锤炼,稳定可靠,性能卓越,官网是http://waisock.szxunxun.com/ ,大家不妨试试。