Python爬虫
JiangNanMax
给生活添砖Java!
展开
-
Python爬取知乎上的图片
Python爬取知乎上的图片# coding=utf-8from urllib import request as rrfrom bs4 import BeautifulSoupimport osimport reurl = "https://www.zhihu.com/question/281282523/answer/473126030" # 指定的URL#下载图片...原创 2018-09-07 16:51:27 · 7361 阅读 · 0 评论 -
return _compile(pattern, flags).findall(string) TypeError: cannot use a string pattern on a bytes-li
return _compile(pattern, flags).findall(string) TypeError: cannot use a string pattern on a bytes-like objectfrom urllib import request as rrimport reurl = 'http://www.baidu.com'content = rr.urlo...原创 2018-10-04 15:17:31 · 7927 阅读 · 4 评论 -
urllib模块中的urlretrieve方法
urllib模块中的urlretrieve方法在做爬虫的时候接触到了urllib模块中的urlretrieve方法,该方法可以直接将远程数据下载到本地,十分方便。之前爬取网络上的图片到本地,需要自己实现两个步骤,首先需要设置好本地的文件路径,然后再使用urlopen方法打开图片的源地址,下载到该路径。然而使用urlretrieve方法的话,就不用那么麻烦了,可以直接在它的参数里给出图片的ur...原创 2018-10-07 21:49:38 · 6322 阅读 · 0 评论