爬虫简单了解(通用爬虫和聚焦爬虫) HTTP和HTTPS HTTP代理神器Fiddler urllib库的基本使用 简单了解get请求实现爬取百度搜索页 批量爬取贴吧页面数据 post方式实现网站注册 Ajax加载方式的数据获取 处理HTTPS请求 SSL证书验证 Handler处理器和自定义Opener ProxyHandler处理器(代理设置) urllib携带cookie爬取网页 http.cookiejar库 和 HTTPCookieProcessor处理器 urllib 的异常错误处理 代码全部由python3实现。 python3urllib爬虫基础教程