网络编程学习笔记3 ------ TCP基础
1. 套接字概念 Socket
在TCP/IP协议中,“IP地址+TCP或UDP端口号”唯一标识网络通讯中的一个进程。“IP地址+TCP/UDP端口号”就对应一个Socket。欲建立连接的两个进程各自有一个socket来标识。那么这两个Socket组成的Socket pair就唯一标识一个连接。因此可以用Socket来描述两个网络连接的一对一关系。
在网络通信中,套接字一定是成对出现的,一端的发送缓冲区对应对端的接收缓冲区,使用的是同一个文件描述符。
- IP地址:在网络环境中,唯一标识一台主机
- 端口号:在网络中的一台主机上,唯一标识一个进程
- IP地址+端口号:在网络环境中,唯一标识一个进程
- Socket:一个文件描述符指向一个套接字,该套接字内部由内核借助两个缓冲区实现
对于UDP来说, <tar IP, tar Port> 来标识
对于TCP来说, <src IP, src Port, tar IP, tar Port> 来标识, 毕竟对于TCP来说,每次接受一个连接,就重新对应了一对TCP连接,所以需要4元组来区别。
2. 网络字节序
内存中的多字节数据相对于内存地址有大端和小端之分,
磁盘文件中的多字节数据相对于文件中的偏移地址也有大端小端之分,
那么如何定义网络数据流中的地址呢?
发送主机通常将发送缓冲区中的数据按内存从低到高的顺序发出,接收主机把从网络上接到的字节序依次保存在接收缓冲区中,也是按照内存地址从低到高的顺序保存,因此,网络数据流的地址也应该从低到高发出。
- 关于大端和小端:大端是低地址存高字节、小端是低地址存低字节
- 其中,地址从上到下是从低到高、字节呢从左到右是从高到低
- 举例:字节123456,12是高位,56是地位,地址从上到下就是低到高
- 因此,大端地地址存高字节读出就是123456,小端就是563412
TCP/IP协议规定,网络数据流应采用大端字节序,即低地址高字节。这样,如果发送主机是小端字节序的话,发送主机在发送到缓冲区之前就需要做字节序的转化 ,同样的,如果接收主机是小端字节序也需要做字节序的转换;当然,如果发送和接收的都是大端字节序,就不需要考虑转换的问题
#include <arpa/inet.h>
uint32_t htonl(uint32_t hostlong);//host to net long
uint16_t htons(uint16_t hostshort);//host to net short
uint32_t ntohl(uint32_t netlong);
uint16_t ntohs(uint16_t netshort);
3. IPv4套接字结构
#include <netinet/in.h>
struct in_addr{
in_addr_t s_addr;
};
struct sockaddr_in{
uint8_t sin_len;
sa_family_t sin_family;
in_port_t sin_port;
struct in_addr sin_addr;
char sin_zero[8];
};
4. IPv6套接字结构
#include <netinet/in.h>
struct in6_addr{
uint8_t s6_addr[16];
};
#define SIN6_LEN
struct sockaddr_in6{
uint8_t sin6_len;
sa_family_t sin6_family;
in_port_t sin6_port;
uint32_t sin6_flowinfo;
struct in6_addr sin6_addr;
uint32_t sin6_scope_id;
};
5. 通用套接字结构
#include <sys/socket.h>
struct sockaddr{
uint8_t sa_len;
sa_family_t sa_family;
char sa_data[14];
};
6. 字节操纵函数
#include <arpa/inet.h>
//返回: 若字符串有效则为1, 否则为0
int inet_aton(const char *strptr, struct in_addr *addrptr);
//返回: 若字符串有效则为32位二进制网络字节序的IPv4地址, 否则位INADDR_NONE
in_addr_t inet_addr(const char *strptr);
//返回: 指向一个点分十进制数串的指针
char* inet_ntoa(struct in_addr inaddr);
#include <arpa/inet.h>
//返回: 若成功则为1, 若输入不是有效的表达格式则位0, 若出错则为-1
int inet_pton(int family, const char *strptr, void *addrptr);
//返回: 若成功则为指向结果的指针,若出错则为NULL
const char* inet_ntop(int family, void *addrptr, char *strptr, size_t len);
7. TCP基础函数
7.1 socket函数
#include <sys/socket.h>
//返回: 若成功则为非负描述符, 若出错则为-1
int socket(int family, int type, int protocol);
family | 声明 |
---|---|
AF_INET | IPv4协议 |
AF_INET6 | IPv6协议 |
AF_LOCAL | Unix域协议 |
AF_ROUTE | 路由套接字 |
AF_KEY | 密钥套接字 |
type | 说明 |
---|---|
SOCK_STREAM | 字节流套接字 |
SOCK_DGRAM | 数据报套接字 |
SOCK_SEQPACKET | 有序分组套接字 |
SOCK_RAW | 原始套接字 |
protocol | 说明 |
---|---|
IPPROTO_CP | TCP传输协议 |
IPPROTO_UDP | UDP传输协议 |
IPPROTO_SCTP | SCTP传输协议 |
7.2 connect函数
#include <sys/socket.h>
//返回: 若成功则为0, 若出错则为-1
int connect(int sockfd, const struct sockaddr *servaddr, socklen_t addrlen);
7.3 bind函数
#include <sys/socket.h>
//返回: 若成功则为0, 若出错则为-1
int bind(int sockfd, const struct sockaddr *myaddr, socklen_t addrlen);
7.4 listen函数
#include <sys/socket.h>
//返回: 若成功则为0, 若出错则为-1
int listen(int sockfd, int backlog);
7.5 accept函数
#include <sys/socket.h>
//返回: 若成功则为非负描述符, 若出错则为-1
int accept(int sockfd, struct sockaddr *cliaddr, socklen_t *addrlen);
8. fork函数
#include <unistd.h>
//返回: 在子进程中为0, 在父进程中为子进程ID,若出错则为-1
pid_t fork(void);
9. getsockname() 和 getpeername
#include <sys/socket.h>
int getsockname(int sockfd, struct sockaddr *localaddr, socklen_t *addrlen);
int getpeername(int sockfd, struct sockaddr *peeraddr, socklen_t *addrlen);
//均返回: 若成功则为0, 若出错则为-1