- 博客(2)
- 资源 (6)
- 收藏
- 关注
原创 网页爬虫WebCrawler(2)-Utilities
在网页爬虫的实现过程中还涉及了一些基本的功能函数,例如获取系统的当前时间函数,进程休眠和字符串替换函数等。我们将这些多次调用的与过程无关的函数写成一个类Utilities。Code://///Utilities.h//*************************//与操作系统相关的函数//*************************#ifndef Uti
2014-10-22 14:26:47
982
原创 网页爬虫WebCrawler(1)-Http网页内容抓取
在windows下的C++通过Http协议实现对网页的内容抓取: 首先介绍下两个重要的包(一般是在linux下的开源数据包,在windows下则调用其动态链接库dll):curl包和pthreads_dll,其中curl包解释为命令行浏览器,通过调用内置的curl_easy_setopt等函数即可实现特定的网页内容获取(正确的编译导入的curl链接库,还需要另外一个包C-ares)。pt
2014-10-21 13:18:38
1503
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅