爬虫实战——批量爬取明星图片(http://www.win4000.com/)
爬取网站
美桌(http://www.win4000.com)
由于该网站并没有robots协议,因此可以任意爬取。
技术路线
requests+re
除此之外用到了pypinyin库用于进行名字到拼音的转换
代码
# -*- coding: utf-8 -*-
"""
Created on Mon Oct 16 20:32:27 2017
@author: 望
"...
原创
2017-10-16 23:19:58 ·
7942 阅读 ·
8 评论