前言
相信大家都非常喜欢那些非常具有趣味性的东西,看到这些搞笑的,总是会让人乐开怀的,让人忘记烦恼,接下来就爬取下糗事百科的那些糗事吧.
首先导入库
给文件加入头信息,伪装成模拟浏览器访问
实现翻页翻页
多次使用正则表达式,运用先抓大再抓小原则。成功抓取纯净的图片地址
是不是跟普通的爬虫没什么区别呢,哈哈,欢迎大家一起学习,交流,共同进步
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/69912078/viewspace-2639161/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/69912078/viewspace-2639161/