urllib库与os库
如果说强大的标准库奠定了python发展的基石,丰富的第三方库则是python不断发展的保证,随着python的发展一些稳定的第三库被加入到了标准库里面,方便我们的编写代码时的使用,今天主要是对urllib库和os库中一些简单函数的介绍。
其他python文章链接:
链接:
1、 Python基础入门语法
2、 Python爬取网站音乐(待补)
3、 Python爬取网站小说(待补)
4、 Python爬取豆瓣书籍汇总(待补)
一、如何在Pycharm中导入第三方库
打开我们的Pycharm软件,新建一个项目,点击菜单栏第一个File->settings,点击settings之后再点击project下面的project Interpreter。接下来点击Latest version右边的“+”,然后在搜索框中搜索需要安装的第三方库(此处搜索urllib)然后点击界面左下角的Install Package进行安装即可。
二、urllib库
urllib库中提供了一系列用于操作URL的功能,这里先放上urllib的官方文档,方便有需要的可以直接查阅:urllib官方文档。urllib库的主要作用是在爬虫过程中请求打开网站链接,方便我们下一步的数据爬取。
1、urllib网络访问
# 【1】===urllib库的使用===
import urllib.request;
# python2.x
# import urllib,urllib2;
# 【2】===设定访问的目标网址====
url = "https://www.i4.cn/wper_1_0_0_1.html";
# 【3】====开始网络链接====
html = urllib.request.urlopen(url);
# 【4】===读取访问网络返回的数据====
data = html.read();
# print(data);
# 【5】===存储到本地====
file = open("01_urllib爱思助手.html","wb",1);
# 【6】===写入数据===
file.write(data