程序功能 实现一个简单的网络爬虫:输入一个网址,遍历下载该页面和其子页面,包括html文件、图片。程序有简单的图形界面,能够随时结束页面爬取。爬取过程中有爬取信息输出。 效果 代码 Github ps:这只是一个简陋的爬虫,仅能爬取一些简单的页面。面对结构复杂的页面和登录验证等无能为力。 相关资料 HTML教程 HTTP教程 正则表达式教程