搜索技术
zdd198410
这个作者很懒,什么都没留下…
展开
-
关于PERL和C++混合编译时容易出现的问题
最近在VC6上,写了个网络爬虫程序,想把它在LINUX下用C++和perl重写,分词解释提取URL部分用perl,其余部分使用c++。 程序中需要两个重要的头文件EXTERN.h和perl.h, 在编译时使用 cc -O2 -Dbool=char -DHAS_BOOL -I/usr/local/include -I/usr/lib/perl/5.8/CO原创 2009-06-23 10:45:00 · 362 阅读 · 0 评论 -
LINUX下SOCKET编程
经常使用的头文件sys/types.hsys/socket.hnetinet/in.harpa/inet.h 编译执行的时候建议使用ROOT用户,否则有可能会产生一些SOCKET错误,因为1024号以下的端口只允许ROOT使用。原创 2009-06-24 09:44:00 · 178 阅读 · 0 评论 -
网络爬虫简单理解
前段时间,看了一个别人的网络爬虫小程序,理解简单网络爬虫的流程大概是这样的。 (1)从URL中得到网页文件。 这个过程在WIN 下显得格外简单,VC提供了一系列的关于网络和HTTP协议的API;而在LINUX下,却能更好的让你理解得到网页文件的过程。首先,你需要从URL信息通过DNS转换得到服务器主机的相关信息,如IP主机名等,有了这些后可以向该主机发送HT原创 2009-06-30 09:51:00 · 497 阅读 · 0 评论