Python网络爬虫之爬取网站图片——urllib库及os库

urllib库与os库一、如何在Pycharm中导入第三方库二、urllib库1、urllib网络访问2、urllib网络图片爬取三、os库如果说强大的标准库奠定了python发展的基石,丰富的第三方库则是python不断发展的保证,随着python的发展一些稳定的第三库被加入到了标准库里面,方便我们的编写代码时的使用,今天主要是对urllib库和os库中一些简单函数的介绍。其他python文...
摘要由CSDN通过智能技术生成

如果说强大的标准库奠定了python发展的基石,丰富的第三方库则是python不断发展的保证,随着python的发展一些稳定的第三库被加入到了标准库里面,方便我们的编写代码时的使用,今天主要是对urllib库和os库中一些简单函数的介绍。

其他python文章链接:
链接:
1、 Python基础入门语法
2、 Python爬取网站音乐(待补)
3、 Python爬取网站小说(待补)
4、 Python爬取豆瓣书籍汇总(待补)

一、如何在Pycharm中导入第三方库

打开我们的Pycharm软件,新建一个项目,点击菜单栏第一个File->settings,点击settings之后再点击project下面的project Interpreter。接下来点击Latest version右边的“+”,然后在搜索框中搜索需要安装的第三方库(此处搜索urllib)然后点击界面左下角的Install Package进行安装即可。

二、urllib库

urllib库中提供了一系列用于操作URL的功能,这里先放上urllib的官方文档,方便有需要的可以直接查阅:urllib官方文档。urllib库的主要作用是在爬虫过程中请求打开网站链接,方便我们下一步的数据爬取。

1、urllib网络访问

# 【1】===urllib库的使用===
import urllib.request;
# python2.x
# import urllib,urllib2;
# 【2】===设定访问的目标网址====
url = "https://www.i4.cn/wper_1_0_0_1.html";
# 【3】====开始网络链接====
html = urllib.request.urlopen(url);
# 【4】===读取访问网络返回的数据====
data = html.read();
# print(data);
# 【5】===存储到本地====
file = open("01_urllib爱思助手.html","wb",1);
# 【6】===写入数据===
file.write(data
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值