前言
前面安装了BeautifulSoup库,现在就来实现一下吧。
目录
一、Urllib库的使用
二、BeautifulSoup的使用
三、 一个示例
------------------------------------------------------------------------------------------------------------
正文
一、Urllib库的使用
看了一些简单爬虫的资料,都用到了Urllib库,想必这也是与web爬取数据的基础,因此先去看了看Urllib库的相关内容。
按我自己的理解,爬取网页的内容其实就是先把页面的信息先通过Urllib库抓取到本地,然后再通过BeautifulSoup库来精细划分抓取得到的页面内容数据。
使用Urllib库的最基本方法其实就三行代码(如下):
# -*- coding: utf-8 -*-
import urllib
res &