/**************************************************************************************************************************
*socket 编程笔记
***************************************************************************************************************************/
1.平台:
这篇文档的代码都是在linux平台的gcc中编译过,由本人编写,测试。
/************************************************************************************************************
2.socket是什么:
你经常听到人们谈论着 “socket”,或许你还不知道它的确切含义。现在让我告诉你:它是 使用 标准Unix 文件描述符 (file descriptor) 和其它程序通讯的方式。
/***********************************************************************************************************
3.Internet套接字有两种类型:
一种是"Stream Sockets"(流格式),另外一种 是"Datagram Sockets"(数据包格式)。我们以后谈到它们的时候也会用到 "SOCK_STREAM" 和 "SOCK_DGRAM"。 数据报套接字有时也叫“无连接套接字”(如果你确实要连接的时候可以用connect()。) 流式套接字是可靠的双向通讯的数据流。如果你向套接字按顺 序输出“1,2”,那么它们将按顺序“1,2”到达另一边。它们是无错误的传递的,有自己的错误控制。
/***********************************************************************************************************
4.sockaddr结构体:
我的第一个结构(在这个技术手册TM中)--struct sockaddr.。这个结构 为许多类型的套接字储存套接字地址信息:
struct sockaddr {
unsigned short sa_family; /* 地址家族, AF_xxx */
char sa_data[14]; /*14字节协议地址*/
};
sa_family 能够是各种各样的类型,但是在这篇文章中都是 "AF_INET"。 sa_data包含套接字中的目标地址和端口信息。这好像有点 不明智。
为了处理struct sockaddr,程序员创造了一个并列的结构: struct sockaddr_in ("in" 代表 "Internet"。)
struct sockaddr_in {
short int sin_family; /* 通信类型 */
unsigned short int sin_port; /* 端口 */
struct in_addr sin_addr; /* Internet 地址 */
unsigned char sin_zero[8]; /* 与sockaddr结构的长度相同*/
};
用这个数据结构可以轻松处理套接字地址的基本元素。注意 sin_zero (它被加入到这个结构,并且长度 和 struct sockaddr 一样) 应该使用函数 bzero() 或 memset() 来全部置零。 同时,这一重要的字节,一个指 向 sockaddr_in结构体的指针也可以被指向结构体sockaddr并且代替它。这 样的话即使 socket() 想要的 是 struct sockaddr *,你仍然可以使用 struct sockaddr_in,并且在最后转换。同时,注 意 sin_family 和 struct sockaddr 中的 sa_family 一致并能够设置为 "AF_INET"。最 后,sin_port和 sin_addr 必须是网络字节顺序 (Network Byte Order)!
你也许会反对道:"但是,怎么让整个数据结构 struct in_addr sin_addr 按照网络字节顺序呢?" 要知道这个问题的答案,我们就要仔细的看一看这 个数据结构: struct in_addr, 有这样一个联合 (unions):
/* Internet 地址 (一个与历史有关的结构) */
struct in_addr {
unsigned long s_addr;
};
/**************************************************************************************************************
5.网络字节顺序和本机字节顺序
你能够转换两种类型: short (两个字节)和 long (四个字节)。这个函 数对于 变量类型 unsigned 也适用。假设你想将 short 从本机字节顺序转 换为网络字节顺序。用 "h" 表示 "本机 (host)",接着 是 "to",然后用 "n" 表 示 "网络 (network)",最后用 "s" 表示 "short": h-to-n-s, 或 者 htons() ("Host to Network Short")。
太简单了...
如果不是太傻的话,你一定想到了由"n","h","s",和 "l"形成的正确 组合,例如这里肯定没有stolh() ("Short to Long Host") 函数,不仅在这里 没有,所有场合都没有。但是这里有:
htons()--"Host to Network Short"
htonl()--"Host to Network Long"
ntohs()--"Network to Host Short"
ntohl()--"Network to Host Long"
/*************************************************************************************************************
6.socket 函数
下面我将讨论一下socket()系统调用。
下面是详细介绍:
#include <sys/types.h>;
#include <sys/socket.h>;
int socket(int domain, int type, int protocol);
但是它们的参数是什么? 首先,domain 应该设置成 "AF_INET",就 象上面的数据结构struct sockaddr_in 中 一样。然后,参数 type 告诉内核 是 SOCK_STREAM 类型还是 SOCK_DGRAM 类型。最后,把 protocol 设置 为 "0"。(注意:有很多种 domain、type,我不可能一一列出了,请看 socket() 的 man帮助。当然,还有一个"更好"的方式去 得到 protocol。同 时请查阅 getprotobyname() 的 man 帮助。)
socket() 只是返回你以后在系统调用种可能用到的 socket 描述符,或 者在错误的时候返回-1。全局变量 errno 中将储存返回的错误值。(请参考 perror() 的 man 帮助。)
/************************************************************************************************************
7.bind()函数
这里是系统调用 bind() 的大概:
#include <sys/types.h>;
#include <sys/socket.h>;
int bind(int sockfd, struct sockaddr *my_addr, int addrlen);
sockfd 是调用 socket 返回的文件描述符。my_addr 是指向数据结构 struct sockaddr 的指针,它保存你的地址(即端口和 IP 地址) 信息。 addrlen 设置为 sizeof(struct sockaddr)。
简单得很不是吗? 再看看例子:
#include <string.h>;
#include <sys/types.h>;
#include <sys/socket.h>;
#define MYPORT 3490
main()
{
int sockfd;
struct sockaddr_in my_addr;
sockfd = socket(AF_INET, SOCK_STREAM, 0); /*需要错误检查 */
my_addr.sin_family = AF_INET; /* host byte order */
my_addr.sin_port = htons(MYPORT); /* short, network byte order */
my_addr.sin_addr.s_addr = inet_addr("132.241.5.10");
memset ( &my_addr, 0, sizeof ( struct sockaddr_in ) ); /* zero the rest of the struct */
/* don't forget your error checking for bind(): */
bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr));
.
.
.
这里也有要注意的几件事情。my_addr.sin_port 是网络字节顺序, my_addr.sin_addr.s_addr 也是的。另外要注意到的事情是因系统的不同, 包含的头文件也不尽相同,请查阅本地的 man 帮助文件。
在 bind() 主题中最后要说的话是,在处理自己的 IP 地址和/或端口的 时候,有些工作是可以自动处理的。
my_addr.sin_port = 0; /* 随机选择一个没有使用的端口 */
my_addr.sin_addr.s_addr = INADDR_ANY; /* 使用自己的IP地址 */
通过将0赋给 my_addr.sin_port,你告诉 bind() 自己选择合适的端 口。同样,将 my_addr.sin_addr.s_addr 设置为 INADDR_ANY,你告诉 它自动填上它所运行的机器的 IP 地址。
如果你一向小心谨慎,那么你可能注意到我没有将 INADDR_ANY 转 换为网络字节顺序!这是因为我知道内部的东 西:INADDR_ANY 实际上就 是 0!即使你改变字节的顺序,0依然是0。但是完美主义者说应该处处一 致,INADDR_ANY或许是12呢? 你的代码就不能工作了,那么就看下面 的代码:
my_addr.sin_port = htons(0); /* 随机选择一个没有使用的端口 */
my_addr.sin_addr.s_addr = htonl(INADDR_ANY);/* 使用自己的IP地址 */
你或许不相信,上面的代码将可以随便移植。我只是想指出,既然你 所遇到的程序不会都运行使用htonl的INADDR_ANY。
bind() 在错误的时候依然是返回-1,并且设置全局错误变量errno。
/************************************************************************************************************
8.connect()函数
connect() 系统调用是这样的:
#include <sys/types.h>;
#include <sys/socket.h>;
int connect(int sockfd, struct sockaddr *serv_addr, int addrlen);
sockfd 是系统调用 socket() 返回的套接字文件描述符。serv_addr 是 保存着目的地端口和 IP 地址的数据结构 struct sockaddr。addrlen 设置 为 sizeof(struct sockaddr)。
想知道得更多吗?让我们来看个例子:
#include <string.h>;
#include <sys/types.h>;
#include <sys/socket.h>;
#define DEST_IP "132.241.5.10"
#define DEST_PORT 23
main()
{
int sockfd;
struct sockaddr_in dest_addr; /* 目的地址*/
sockfd = socket(AF_INET, SOCK_STREAM, 0); /* 错误检查 */
dest_addr.sin_family = AF_INET; /* host byte order */
dest_addr.sin_port = htons(DEST_PORT); /* short, network byte order */
dest_addr.sin_addr.s_addr = inet_addr(DEST_IP);
memset ( &dest_addr, 0, sizeof ( struct sockaddr_in ) ); /* zero the rest of the struct */
/* don't forget to error check the connect()! */
connect(sockfd, (struct sockaddr *)&dest_addr, sizeof(struct sockaddr));
.
.
.
再一次,你应该检查 connect() 的返回值--它在错误的时候返回-1,并 设置全局错误变量 errno。
同时,你可能看到,我没有调用 bind()。因为我不在乎本地的端口号。 我只关心我要去那。内核将为我选择一个合适的端口号,而我们所连接的 地方也自动地获得这些信息。一切都不用担心。
/*************************************************************************************************************
9. listen()函数
系统调用 listen 也相当简单。
int listen(int sockfd, int backlog);
sockfd 是调用 socket() 返回的套接字文件描述符。backlog 是在进入 队列中允许的连接数目。什么意思呢? 进入的连接 是在队列中一直等待直 到你接受 (accept() 请看下面的文章)连接。它们的数目限制于队列的允许。 大多数系统的允许数目是20,你也可以设置 为5到10。
和别的函数一样,在发生错误的时候返回-1,并设置全局错误变量 errno。
你可能想象到了,在你调用 listen() 前你或者要调用 bind() 或者让内 核随便选择一个端口。如果你想侦听进入的连接,那么系统调用的顺序可 能是这样的:
socket();
bind();
listen();
/* accept() 应该在这 */
因为它相当的明了,我将在这里不给出例子了。(在 accept() 那一章的 代码将更加完全。)真正麻烦的部分在 accept()。
/**********************************************************************************************************************************
10. accept()函数
函数是这样定义的:
#include <sys/socket.h>;
int accept(int sockfd, void *addr, int *addrlen);
sockfd 相当简单,是和 listen() 中一样的套接字描述符。addr 是个指 向局部的数据结构 sockaddr_in 的指 针。这是要求接入的信息所要去的地 方(你可以测定那个地址在那个端口呼叫你)。在它的地址传递给 accept 之 前,addrlen 是个局部的整 形变量,设置为 sizeof(struct sockaddr_in)。 accept 将不会将多余的字节给 addr。如果你放入的少些,那么它会 通过改
变 addrlen 的值反映出来。
同样,在错误时返回-1,并设置全局错误变量 errno。
现在是你应该熟悉的代码片段。
#include <string.h>;
#include <sys/socket.h>;
#include <sys/types.h>;
#define MYPORT 3490 /*用户接入端口*/
#define BACKLOG 10 /* 多少等待连接控制*/
main()
{
int sockfd, new_fd; /* listen on sock_fd, new connection on new_fd */
struct sockaddr_in my_addr; /* 地址信息 */
struct sockaddr_in their_addr; /* connector's address information */
int sin_size;
sockfd = socket(AF_INET, SOCK_STREAM, 0); /* 错误检查*/
my_addr.sin_family = AF_INET; /* host byte order */
my_addr.sin_port = htons(MYPORT); /* short, network byte order */
my_addr.sin_addr.s_addr = INADDR_ANY; /* auto-fill with my IP */
memset ( &my_addr, 0, sizeof ( struct sockaddr_in ) ); /* zero the rest of the struct */
/* don't forget your error checking for these calls: */
bind(sockfd, (struct sockaddr *)my_addr, sizeof(struct sockaddr));
listen(sockfd, BACKLOG);
sin_size = sizeof(struct sockaddr_in);
new_fd = accept(sockfd, their_addr, sin_size);
.
.
.
注意,在系统调用 send() 和 recv() 中你应该使用新的套接字描述符 new_fd。如果你只想让一个连接进来,那么你可以使用 close() 去关闭原 来的文件描述符 sockfd 来避免同一个端口更多的连接。
/**********************************************************************************************************************************
11. send() and recv()函数 , sendto() 和 recvfrom()函数
send() 是这样的:
int send(int sockfd, const void *msg, int len, int flags);
sockfd 是你想发送数据的套接字描述符(或者是调用 socket() 或者是 accept() 返回的。)msg 是指向你想发送的数 据的指针。len 是数据的长度。 把 flags 设置为 0 就可以了。(详细的资料请看 send() 的 man page)。
这里是一些可能的例子:
char *msg = "Beej was here!";
int len, bytes_sent;
.
.
len = strlen(msg);
bytes_sent = send(sockfd, msg, len, 0);
.
.
.
send() 返回实际发送的数据的字节数--它可能小于你要求发送的数 目! 注意,有时候你告诉它要发送一堆数据可是它不能处理成功。它只 是 发送它可能发送的数据,然后希望你能够发送其它的数据。记住,如果 send() 返回的数据和 len 不匹配,你就应该发送其它的数据。但是这里 也 有个好消息:如果你要发送的包很小(小于大约 1K),它可能处理让数据一 次发送完。最后要说得就是,它在错误的时候返回-1,并设 置 errno。
recv() 函数很相似:
int recv(int sockfd, void *buf, int len, unsigned int flags);
sockfd 是要读的套接字描述符。buf 是要读的信息的缓冲。len 是缓 冲的最大长度。flags 可以设置为0。(请参考 recv() 的 man page。) recv() 返回实际读入缓冲的数据的字节数。或者在错误的时候返回-1, 同时设置 errno。
很简单,不是吗? 你现在可以在流式套接字上发送数据和接收数据了。 你现在是 Unix 网络程序员了!
sendto() 和 recvfrom()函数
“这很不错啊”,你说,“但是你还没有讲无连接数据报套接字呢?” 没问题,现在我们开始这个内容。
既然数据报套接字不是连接到远程主机的,那么在我们发送一个包之 前需要什么信息呢? 不错,是目标地址!看看下面的:
int sendto(int sockfd, const void *msg, int len, unsigned int flags,
const struct sockaddr *to, int tolen);
你已经看到了,除了另外的两个信息外,其余的和函数 send() 是一样 的。 to 是个指向数据结构 struct sockaddr 的 指针,它包含了目的地的 IP 地址和端口信息。tolen 可以简单地设置为 sizeof(struct sockaddr)。 和函 数 send() 类似,sendto() 返回实际发送的字节数(它也可能小于 你想要发送的字节数!),或者在错误的时候返回 -1。
相似的还有函数 recv() 和 recvfrom()。recvfrom() 的定义是这样的:
int recvfrom(int sockfd, void *buf, int len, unsigned int flags, struct sockaddr *from, int *fromlen);
又一次,除了两个增加的参数外,这个函数和 recv() 也是一样的。from 是一个指向局部数据结构 struct sockaddr 的 指针,它的内容是源机器的 IP 地址和端口信息。fromlen 是个 int 型的局部指针,它的初始值 为 sizeof(struct sockaddr)。函数调用返回后,fromlen 保存着实际储存在 from 中的地址的长度。
recvfrom() 返回收到的字节长度,或者在发生错误后返回 -1。
记住,如果你用 connect() 连接一个数据报套接字,你可以简单的调 用 send() 和 recv() 来满足你的要求。这个时候依然是数据报套接字,依 然使用 UDP,系统套接字接口会为你自动加上了目标和源的信息。
/***********************************************************************************************************************************
12. 简单的服务器
/**************************************************************************
*
*文件名:server.c
*
*作者:
*
*释义:socket服务器端
*
*************************************************************************/
#ifndef _STD_H_
#define _STD_H_
#include<stdio.h>
#include<stdlib.h>
#include<errno.h>
#include<string.h>
#include<sys/types.h>
#include<netinet/in.h>
#include<sys/socket.h>
#include<sys/wait.h>
#include<malloc.h>
#define MYPORT 3480/*port for conect*/
#define BACKLOG 10/*how many wait for server*/
#define MAXDATASIZE 100/*size of buff*/
#endif
/**********************************************************************
*
**********************************************************************/
/*数据包结构体*/
struct pag {
char ip[20];
char url[20];
};
/*********************************************************************
* 主函数
*********************************************************************/
int main( ){
struct pag recv_pag;/*receive pag*/
struct sockaddr_in my_addr, their_addr;/*address for my and their*/
char recv_buff [ MAXDATASIZE ];/*recvive buff*/
int sock_fd, new_fd, sin_size;
/*socket for my and their and the size of struct sockaddr_in*/
/************************************************************************
* zero space
************************************************************************/
memset ( &recv_pag, 0, sizeof ( struct pag ) );
memset ( &my_addr, 0, sizeof ( struct sockaddr_in ) );
memset ( &their_addr, 0, sizeof ( struct sockaddr_in ) );
memset ( recv_buff, 0, sizeof ( ( char ) * MAXDATASIZE ) );
/********************************************************************
*get socket
*******************************************************************/
if ( ( sock_fd = socket ( AF_INET, SOCK_STREAM, 0 ) ) == -1 ) {/*get sock*/
perror( "socket" );
exit( 1 );
}
/***********************************************************************
*initial my_addr
************************************************************************/
my_addr.sin_family = AF_INET; /*host byte order*/
my_addr.sin_port = htons ( MYPORT ); /*network byte order*/
my_addr.sin_addr.s_addr = INADDR_ANY;/*auto-fill my ip*/
/***********************************************************************
*bind socket and myport
***********************************************************************/
if ( bind ( sock_fd, ( struct sockaddr * ) &my_addr,
sizeof(struct sockaddr ) ) == -1) {
perror ( "bind" );
exit ( 1 );
}
/**********************************************************************
*listen myport
**********************************************************************/
if ( listen ( sock_fd, BACKLOG ) == -1 ) {
perror ( "listen" );
exit ( 1 );
}
/**********************************************************************
*accept loop
***********************************************************************/
sin_size = sizeof ( struct sockaddr_in );
while ( 1 ) {
if ( ( new_fd = accept ( sock_fd, ( struct sockaddr * ) &their_addr,
&sin_size ) ) == -1 ) {
perror ( "accept" );
continue;
}
if ( !fork ( ) ) {
if ( recv ( new_fd, recv_buff, MAXDATASIZE, 0 ) == -1 )
perror ( "recv" );
memcpy ( &recv_pag, recv_buff, sizeof ( struct pag ) );
printf ( "recvived:ip: %s url: %s/n", recv_pag.ip, recv_pag.url );
memset ( recv_buff, 0, sizeof ( ( ( char ) * MAXDATASIZE ) ) );
memset ( &recv_pag, 0, sizeof ( struct pag ) );
close ( new_fd );
exit ( 0 );
}
close ( new_fd );
}
/*************************************************************************
*return
**************************************************************************/
return 0;
}
13.简单的客户端
/*************************************************************************
*
*文件名:customer.c
*
*作者:
*
*释义:socket客户端
*
************************************************************************/
#ifndef _STD_H_
#define _STD_H_
#include<stdio.h>
#include<stdlib.h>
#include<errno.h>
#include<sys/types.h>
#include<netinet/in.h>
#include<sys/socket.h>
#include<sys/wait.h>
#include<string.h>
#define PORT 3480/*my port*/
#define MAXDATASIZE 100/*the size of buff*/
#endif
/**************************************************************************
*结构体定义
**************************************************************************/
struct pag {
char ip [ 20 ];
char url [ 20 ];
};
/*************************************************************************
*主函数*
*************************************************************************/
int main ( int argc, char **argv ) {
int sock_fd;
char send_buff[MAXDATASIZE];
struct sockaddr_in their_addr;
struct pag send_pag;
char *srvr_addr = NULL;
/***********初始化*******************************************************/
memset ( send_buff, 0, sizeof ( ( ( char ) *MAXDATASIZE ) ) );
memset ( &their_addr, 0, sizeof ( struct sockaddr_in ) );
memset ( &send_pag, 0, sizeof ( struct pag ) );
strcpy ( send_pag.ip, "127.0.0.1" );
strcpy( send_pag.url, "www.google.com" );
if(argc>=2)
srvr_addr=argv[1];
else
srvr_addr = "192.168.2.101";
/**************************************************************************
*get socket
**************************************************************************/
if ( ( sock_fd = socket ( AF_INET, SOCK_STREAM, 0 ) ) == -1 ) {
perror ( "socket" );
exit ( 1 );
}
/************************************************************************
*inital myaddr
************************************************************************/
their_addr.sin_family = AF_INET;
their_addr.sin_port = htons ( PORT );
their_addr.sin_addr.s_addr = inet_addr ( srvr_addr );
/*************************************************************************
*connect *
************************************************************************/
if ( connect ( sock_fd, ( struct sockaddr * ) &their_addr,
sizeof ( struct sockaddr ) ) == -1 ) {
perror("connect");
exit(1);
}
memset ( send_buff, 0, MAXDATASIZE );/*inital buff*/
memcpy ( send_buff, &send_pag, sizeof ( send_pag ) );
/*char cov_to struct*/
/************************************************************************
*send buff to their_addr
**************************************************************************/
if ( send ( sock_fd, send_buff, MAXDATASIZE, 0 ) == -1 ) {
perror("send");
exit(1);
}
close ( sock_fd );
/************************************************************************
*return
************************************************************************/
return 0;
}
好了,大功告成,客户端发出IP和URL服务器端就可以接收了。