Python 爬虫（爬取图片）

最新推荐文章于 2022-11-25 22:47:32 发布

YLY TXD

最新推荐文章于 2022-11-25 22:47:32 发布

阅读量299

点赞数

分类专栏： Python自学文章标签： python

本文链接：https://blog.csdn.net/weixin_57806803/article/details/126075556

版权

Python自学专栏收录该内容

15 篇文章 0 订阅

订阅专栏

Python如何访问互联网

urllib包

URL的一般格式为（带方括号[]的为可选项）: protocol://hostname

URL由三部分组成：

第一部分时协议：http,https,ftp,file,ed2k..
第二部分是存放资源的服务器域名系统或IP地址
第三部分是资源具体的地址

import urllib.request  #导入包中的request模块
response = urllib.request.urlopen("http://www.baidu.com")#从服务器上获取网页
#获取到的网页是一个对象

#读取对象
html = response.read() #读取出的是二进制的字符串

#解码二进制字符串
html = html.decode("utf-8")
print(html)

爬取图片

import urllib.request

response = urllib.request.urlopen("http://placekitten.com/g/500/600")
img = response.read()

with open('下载的图片2.jpg' , 'wb') as f:
    f.write(img)

YLY TXD

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Python 爬虫（爬取图片）

Python如何访问互联网urllib包URL的一般格式为（带方括号[]的为可选项）: protocol://hostnameURL由三部分组成：第一部分时协议：http,https,ftp,file,ed2k..第二部分是存放资源的服务器域名系统或IP地址第三部分是资源具体的地址...
复制链接

扫一扫