用tcpdump分析协议后用C语言自己编写一个BBS发贴机器人
大家可能经常上各种论坛发贴,但每次都要打开论坛、登录、输入贴子主题、贴子内容,然后点提交才可以完成。
如果你发贴比较少,可能不算什么,但如果你经常发,在很多网站发贴,可不容易哦,发贴可能花你好多时间。
鉴于这种苦恼,我自己想了一个简单方法,那就是分析一下网络协议,找到每次发贴内容变化的部分,再用C语言来写一个小程序,以后每次只要写好主题和贴子内容,运行那个小程序就可以完成发贴了。
当然,可以把程序的配置文件做齐全一点,就可以实现一次输入同时向N个论坛发贴了。呵,肯定有人想到了把这个程序设成定时运行的,那么就可以每隔一定时间往某个版发一次了。各位版主可要想好防止策略啊,我不能保证大家都正常使用我的代码。
1、tcpdump
首先,如果要实现机器自动发贴,你得人工分析一下要发贴的论坛,这里得用一个工具tcpdump。
tcpdump是个tcp流分析工具,通常我用来调试网络故障,因为从这上面比较容易看到网络通讯过程,可以大致分析到通讯两端谁出了问题。
基本用法是:
tcpdump -X -s0 host x.y.z.c port p
这里x.y.z.c是你要跟踪的主机的IP地址,p是端口号。
一个网站的IP地址比较容易获得,一种方法是通过DNS查询,另一种简单方法就是你打开浏览器,只打开那一个网站,同时用netstat -anp|grep ESTABLISHED命令就可以看到对方的IP了,通常端口是80的就是了。
但上面这种命令格式并不很方便,比如我对跟踪结果如下:tcpdump -X -s0 host 220.181.28.42
Password:
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on eth0, link-type EN10MB (Ethernet), capture size 65535 bytes
21:13:14.585191
IP 172.16.100.218.37028 > 220.181.28.42.www: S
823660970:823660970(0) win 5840 0x0000: 4500 003c caac 4000 4006 6645 ac10 64da E..0x0010: dcb5 1c2a 90a4 0050 3118 11aa 0000 0000 ...*...P1.......
0x0020: a002 16d0 7804 0000 0204 05b4 0402 080a ....x...........
0x0030: 00a9 db06 0000 0000 0103 0302 ............
21:13:15.042840
IP 220.181.28.42.www > 172.16.100.218.37028: S
2097205944:2097205944(0) ack 823660971 win 5792 0x0000: 4500 003c 0000 4000 3406 3cf2 dcb5 1c2a E..0x0010: ac10 64da 0050 90a4 7d00 d2b8 3118 11ab ..d..P..}...1...
0x0020: a012 16a0 ecca 0000 0204 05b4 0402 080a ................
0x0030: 81b3 b9e6 00a9 db06 0103 0307 ............
21:13:15.042887 IP 172.16.100.218.37028 > 220.181.28.42.www: . ack 1 win 1460 0x0000: 4500 0034 caad 4000 4006 664c ac10 64da .
0x0010: dcb5 1c2a 90a4 0050 3118 11ab 7d00 d2b9 ...*...P1...}...
0x0020: 8010 05b4 2c10 0000 0101 080a 00a9 db79 ....,..........y
0x0030: 81b3 b9e6 ....
21:13:15.043037
IP 172.16.100.218.37028 > 220.181.28.42.www: P 1:700(699) ack 1 win
1460 0x0000: 4500 02ef caae 4000 4006 6390 ac10 64da .
0x0010: dcb5 1c2a 90a4 0050 3118 11ab 7d00 d2b9 ...*...P1...}...
0x0020: 8018 05b4 e97c 0000 0101 080a 00a9 db79 .....|.........y
0x0030: 81b3 b9e6 4745 5420 2f20 4854 5450 2f31 ....GET./.HTTP/1
0x0040: 2e31 0d0a 486f 7374 3a20 7777 772e 3136 .1..Host:.
0x0050: 332e 636f 6d0d 0a55 7365 722d 4167 656e 3.com..User-Agen
0x0060: 743a 204d 6f7a 696c 6c61 2f35 2e30 2028 t:.Mozilla/5.0.(
0x0070: 5831 313b 2055 3b20 4c69 6e75 7820 6936 X11;.U;.Linux.i6
0x0080: 3836 3b20 7a68 2d43 4e3b 2072 763a 312e 86;.zh-CN;.rv:1.
0x0090: 382e 302e 3429 2047 6563 6b6f 2f32 3030 8.0.4).Gecko/200
0x00a0: 3630 3631 3120 5562 756e 7475 2f75 6e73 60611.Ubuntu/uns
0x00b0: 7461 626c 6520 4669 7265 666f 782f 312e table.Firefox/1.
0x00c0: 352e 302e 340d 0a41 6363 6570 743a 2074 5.0.4..Accept:.t
0x00d0: 6578 742f 786d 6c2c 6170 706c 6963 6174 ext/xml,applicat
0x00e0: 696f 6e2f 786d 6c2c 6170 706c 6963 6174 ion/xml,applicat
0x00f0: 696f 6e2f 7868 746d 6c2b 786d 6c2c 7465 ion/xhtml+xml,te
0x0100: 7874 2f68 746d 6c3b 713d 302e 392c 7465 xt/html;q=0.9,te
0x0110: 7874 2f70 6c61 696e 3b71 3d30 2e38 2c69 xt/plain;q=0.8,i
0x0120: 6d61 6765 2f70 6e67 2c2a 2f2a 3b71 3d30 mage/png,*/*;q=0
0x0130: 2e35 0d0a 4163 6365 7074 2d4c 616e 6775 .5..Accept-Langu
0x0140: 6167 653a 207a 682d 636e 2c7a 683b 713d age:.zh-cn,zh;q=
0x0150: 302e 350d 0a41 6363 6570 742d 456e 636f 0.5..Accept-Enco
0x0160: 6469 6e67 3a20 677a 6970 2c64 6566 6c61 ding:.gzip,defla
0x0170: 7465 0d0a 4163 6365 7074 2d43 6861 7273 te..Accept-Chars
0x0180: 6574 3a20 6762 3233 3132 2c75 7466 2d38 et:.gb2312,utf-8
0x0190: 3b71 3d30 2e37 2c2a 3b71 3d30 2e37 0d0a ;q=0.7,*;q=0.7..
0x01a0: 4b65 6570 2d41 6c69 7665 3a20 3330 300d Keep-Alive:.300.
0x01b0: 0a43 6f6e 6e65 6374 696f 6e3a 206b 6565 .Connection:.kee
0x01c0: 702d 616c 6976 650d 0a43 6f6f 6b69 653a p-alive..Cookie:
0x01d0: 2050 726f 7669 6e63 653d 3032 303b 204d .Province=020;.M
0x01e0: 4149 4c31 3633 5f53 534e 3d67 646c 6374 AIL163_SSN=gdlct
0x01f0: 6573 743b 205f 6e74 6573 5f6e 6e73 6974 est;._ntes_nnsit
0x0200: 3d7c 7777 777c 6375 6c74 7572 657c 6865 =|www|culture|he
0x0210: 616c 7468 7c73 746f 636b 7c75 7273 7c74 alth|stock|urs|t
0x0220: 7261 7665 6c7c 3b20 5f6e 7465 735f 6e76 ravel|;._ntes_nv
0x0230: 746d 3d31 323b 204e 4554 4541 5345 5f53 tm=12;.NETEASE_S
0x0240: 534e 3d67 646c 6366 6f72 6d65 3b20 7468 SN=gdlcforme;.th
0x0250: 6561 6464 723d b9e3 b6ab 3b20 7171 6d61 eaddr=....;.qqma
0x0260: 696c 3d67 646c 6366 6f72 6d65 4031 3633
0x0270: 2e63 6f6d 3b20 4e45 5445 4153 455f 4144 .com;.NETEASE_AD
0x0280: 563d 3131 2632 353b 2043 6974 793d 3032 V=11&25;.City=02
0x0290: 300d 0a49 662d 4d6f 6469 6669 6564 2d53 0..If-Modified-S
0x02a0: 696e 6365 3a20 4d6f 6e2c 2032 3420 4a75 ince:.Mon,.24.Ju
0x02b0: 6c20 3230 3036 2031 333a 3132 3a30 3020 l.2006.13:12:00.
0x02c0: 474d 540d 0a49 662d 4e6f 6e65 2d4d 6174 GMT..If-None-Mat
0x02d0: 6368 3a20 2231 6162 3265 312d 3133 6264 ch:."1ab2e1-13bd
0x02e0: 382d 3937 3638 3038 3030 220d 0a0d 0a 8-97680800"....
21:13:15.556849 IP 220.181.28.42.www > 172.16.100.218.37028: . ack 700 win 57 0x0000: 4500 0034 6eb9 4000 3406 ce40 dcb5 1c2a ..@...*
0x0010: ac10 64da 0050 90a4 7d00 d2b9 3118 1466 ..d..P..}...1..f
0x0020: 8010 0039 2ca8 0000 0101 080a 81b3 bc0e ...9,...........
0x0030: 00a9 db79 ...y
21:13:15.558577
IP 220.181.28.42.www > 172.16.100.218.37028: P 1:184(183) ack 700
win 57 0x0000: 4500 00eb 6ebb 4000 3406 cd87 dcb5 1c2a ......*
0x0010: ac10 64da 0050 90a4 7d00 d2b9 3118 1466 ..d..P..}...1..f
0x0020: 8018 0039 38af 0000 0101 080a 81b3 bc0f ...98...........
0x0030: 00a9 db79 4854 5450 2f31 2e30 2033 3034 ...yHTTP/1.0.304
0x0040: 204e 6f74 204d 6f64 6966 6965 640d 0a44 .Not.Modified..D
0x0050: 6174 653a 204d 6f6e 2c20 3234 204a 756c ate:.Mon,.24.Jul
0x0060: 2032 3030 3620 3133 3a31 333a 3133 2047 .2006.13:13:13.G
0x0070: 4d54 0d0a 5365 7276 6572 3a20 4170 6163 MT..Server:.Apac
0x0080: 6865 2f32 2e30 2e35 3220 2855 6e69 7829 he/2.0.52.(Unix)
0x0090: 0d0a 4554 6167 3a20 2231 6162 3265 312d ..ETag:."1ab2e1-
0x00a0: 3133 6264 382d 3937 3638 3038 3030 220d 13bd8-97680800".
0x00b0: 0a58 2d43 6163 6865 3a20 4d49 5353 2066 .X-Cache:.MISS.f
0x00c0: 726f 6d20 7777 772e 3136 332e 636f 6d0d rom.3.com.
0x00d0: 0a43 6f6e 6e65 6374 696f 6e3a 206b 6565 .Connection:.kee
0x00e0: 702d 616c 6976 650d 0a0d 0a p-alive....
21:13:15.558601 IP 172.16.100.218.37028 > 220.181.28.42.www: . ack 184 win 1728 0x0000: 4500 0034 caaf 4000 4006 664a ac10 64da .
0x0010: dcb5 1c2a 90a4 0050 3118 1466 7d00 d370 ...*...P1..f}..p
0x0020: 8010 06c0 24e8 0000 0101 080a 00a9 dbfa ....$...........
0x0030: 81b3 bc0f ....2、tcpdump专门针对http协议的分析
tcpdump有个专门用来分析http协议的参数A,使用起来就是这样的:
tcpdump -A -s0 host 220.181.28.42
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on eth0, link-type EN10MB (Ethernet), capture size 65535 bytes
21:16:25.130387
IP 172.16.100.218.48508 > 220.181.28.42.www: S
1030084898:1030084898(0) win 5840 E..............
21:16:25.705703
IP 220.181.28.42.www > 172.16.100.218.48508: S
915774756:915774756(0) ack 1030084899 win 5792 E...21:16:25.705759 IP 172.16.100.218.48508 > 220.181.28.42.www: . ack 1 win 1460 ...........
.....21:16:25.705895
IP 172.16.100.218.48508 > 220.181.28.42.www: P 1:700(699) ack 1 win
1460 ...........
.....Host:
User-Agent: Mozilla/5.0 (X11; U; Linux i686; zh-CN; rv:1.8.0.4) Gecko/20060611 Ubuntu/unstable Firefox/1.5.0.4
Accept: text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
Accept-Language: zh-cn,zh;q=0.5
Accept-Encoding: gzip,deflate
Accept-Charset: gb2312,utf-8;q=0.7,*;q=0.7
Keep-Alive: 300
Connection: keep-alive
Cookie:
Province=020; MAIL163_SSN=gdlctest;
_ntes_nnsit=|www|culture|health|stock|urs|travel|; _ntes_nvtm=12;
NETEASE_SSN=gdlcforme; theaddr=....; ; NETEASE_ADV=11&25; City=020
If-Modified-Since: Mon, 24 Jul 2006 13:12:00 GMT
If-None-Match: "1ab2e1-13bd8-97680800"
21:16:26.288904 IP 220.181.28.42.www > 172.16.100.218.48508: . ack 700 win 57 .......
.21:16:26.299749
IP 220.181.28.42.www > 172.16.100.218.48508: P 1:1448(1447) ack 700
win 57 ;.....
.Date: Mon, 24 Jul 2006 13:16:24 GMT
Server: Apache/2.0.52 (Unix)
Last-Modified: Mon, 24 Jul 2006 13:15:01 GMT
ETag: "1ab2e6-13bd8-a231df40"
Accept-Ranges: bytes
Vary: Accept-Encoding,User-Agent
Content-Encoding: gzip
Content-Length: 22079
Content-Type: text/html; charset=GB2312
X-Cache: MISS from
Connection: keep-alive
.............w...0.9.+.q..bK3......CB....p_..X.."........7.....$&.&o.ny.7y....B ...
%V3..P.^A...D\.....].+q...`).e..n_....#LYZ.8...........:...p..g.Y.t.7.K.H./...u.....:..[D.}.H.......F.
.....r...G.."..:.....]......~.c.nOS....mT.../b...b.?.b..M...8....y6.v;..O...ryX..E.Hq..(A..+`..N...,y.$.J
...........<6.q.X.(S..G..
u$......q.1D......J..
.WqO..LH....>.W........?.W........}..pCQ........_.........._.q.+Y..2..%.EJ.H.E).J.
........ ..S..htp`H...5.. Pi..J(Hd".+..[..b..[.B...X..3..... 3#.&\...eq$..*P.=.,u.../."...b.u
w..)....S..
...zi..z.0.o.......~....l....".21:16:26.299775
IP 172.16.100.218.48508 > 220.181.28.42.www: . ack 1448 win 2184
..............
...
这样就很清楚地看到你的主机和对方通信的过程如下:
首先,你的主机和对方TCP三次握手建立连接,
然后,你的主机向对方发了一个http请求:
GET / HTTP/1.1
Host:
User-Agent: Mozilla/5.0 (X11; U; Linux i686; zh-CN; rv:1.8.0.4) Gecko/20060611 Ubuntu/unstable Firefox/1.5.0.4
Accept: text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
Accept-Language: zh-cn,zh;q=0.5
Accept-Encoding: gzip,deflate
Accept-Charset: gb2312,utf-8;q=0.7,*;q=0.7
Keep-Alive: 300
Connection: keep-alive
Cookie:
Province=020; MAIL163_SSN=gdlctest;
_ntes_nnsit=|www|culture|health|stock|urs|travel|; _ntes_nvtm=12;
NETEASE_SSN=gdlcforme; theaddr=....; ; NETEASE_ADV=11&25; City=020
If-Modified-Since: Mon, 24 Jul 2006 13:12:00 GMT
If-None-Match: "1ab2e1-13bd8-97680800"最后,对方回复了一个http请求:
HTTP/1.0 200 OK
Date: Mon, 24 Jul 2006 13:16:24 GMT
Server: Apache/2.0.52 (Unix)
Last-Modified: Mon, 24 Jul 2006 13:15:01 GMT
ETag: "1ab2e6-13bd8-a231df40"
Accept-Ranges: bytes
Vary: Accept-Encoding,User-Agent
Content-Encoding: gzip
Content-Length: 22079
Content-Type: text/html; charset=GB2312
X-Cache: MISS from
Connection: keep-alive
后面就是22079字节的网页内容,这里省去没有显示啦。
3、自己用C语言来写一个这样的程序吧
现在假设我要去这个论坛去发贴,发贴步骤是这样的:
Step.1、打开论坛首页
Step.2、输入用户名和密码登录
Step.3、点击某个版
Step.4、点击发表新贴
Step.5、输入自己的内容,点击提交
C语言源代码如下:
/* ****** 用tcpdump分析协议后用C语言自己编写一个BBS发贴机器人 bbsrobot.c 开始 *********** */
#include #include #include #include #include #include #include #include #include #include #include #include
/* some global variable */
#ifdefine OS_LINUX
#define USER_AGENT "Mozilla/5.0 (X11; U; Linux i686; zh-CN; rv:1.8.0.4) Gecko/20060611 Ubuntu/unstable Firefox/1.5.0.4"
#else
#define USER_AGENT "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)"
#endif
#define SERVER_HOST ""
#define CLIENT_ACCEPT "text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5"
#define CLIENT_LANGUAGE "zh-cn,zh;q=0.5"
#define CLIENT_CHARSET "gb2312,utf-8;q=0.7,*;q=0.7"
#define BORDID 52
struct sockaddr_in server_addr;
int portnumber = 0, sockfd = 0, dsend = 0, totalsend = 0, nbytes = 0, reqn = 0, i = 0, j = 0, ret = 0;
struct hostent *host;
char request[1024] = "", buffer[1024] = "", httpheader[1024] = "";
/* some functions */
void ConnectWeb(void) { /* 连接网站 */
/* create a socket descriptor */
if((sockfd=socket(AF_INET,SOCK_STREAM,0))==-1)
{
fprintf(stderr,"Socket Error:%s\a\n",strerror(errno));
exit(1);
}
/* bind address */
bzero(&server_addr,sizeof(server_addr));
server_addr.sin_family=AF_INET;
server_addr.sin_port=htons(portnumber);
server_addr.sin_addr=*((struct in_addr *)host->h_addr);
/* connect to the server */
if(connect(sockfd,(struct sockaddr *)(&server_addr),sizeof(struct sockaddr))==-1)
{
fprintf(stderr,"Connect Error:%s\a\n",strerror(errno));
exit(1);
}
}
/************关于本文档********************************************
*filename:用tcpdump分析协议后用C语言自己编写一个BBS发贴机器人
*purpose:自己编写的一个http协议网络客户端程序,可以用来定时往网站发贴
*wrote by: zhoulifa() 周立发()
Linux爱好者 Linux知识传播者 SOHO族 开发者 最擅长C语言编程
*date time:2006-07-24 21:00:00
*Note: 任何人可以任意复制代码并运用这些文档,当然包括你的商业用途
* 但请遵循GPL。
*Hope:希望越来越多的人贡献自己的力量,为科学技术发展出力
*********************************************************************/
语言入门经典教程--C语言使用者必须收藏的精华教程.doc