使用Beautiful Soup解析网页

本文介绍了Python库BeautifulSoup的作用,它主要用于从网页中抓取数据。首先,讲解了如何通过PyCharm安装bs4和lxml库,其中lxml提供更强大的解析功能。接着,展示了如何调用BeautifulSoup并使用它解析指定URL的HTML内容,通过select方法获取特定元素的数据。最后,给出了运行结果,显示了抓取的数据。
摘要由CSDN通过智能技术生成

一、“Beautiful Soup”的作用:
“Beautiful Soup”是“Python”的一个库,其主要功能是从网页中抓取数据。
二、相关第三方库的安装:
“Beautiful Soup”目前已经被移植到“bs4”库中,导入“Beautiful Soup”需要先安装bs4库。
(1)、安装“bs4”库类似于“requests”安装:PyCharm中安装requests库
(2)、安装好“bs4”以后还需要安装“lxml”库,方法类似于“bs4”库安装。(不安装lxml库,就会使用Python默认的解析器,但lxml功能更加强大,速度更快。)
在这里插入图片描述
三、“Beautiful Soup”的调用:

from bs4 import BeautifulSoup

四、“Beautiful Soup”的简单使用:
(1)、操作页面:
在这里插入图片描述
(2)、代码:

import requests  #导入requests包
from bs4 import BeautifulSoup #导入eautifulSoup

url='http://www.cntour.cn/'
Strhtml = requests.get(url)  # GET方式,获取网页数据
soup = BeautifulSoup(Strhtml.text,'lxml')
data = soup.select('#main > div > div.mtop.firstMod.clearfix > div.centerBox > ul.newsList > li > a')

print(data)  #数据打印

(3)、运行结果:
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Z_凌云

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值