BeautifuSoup库以及findALL中参数

本文介绍了如何安装和理解BeautifulSoup库,并详细展示了如何利用该库遍历HTML内容,包括获取特定标签、属性和文本。
摘要由CSDN通过智能技术生成

一、安装BeautifuSoup库

以管理员打开cmd输入:pip install BeautifuSoup4

二、BeautifuSoup库的理解

BeautifuSoup库是解析、遍历、维护”标签树“的功能库

在这里插入图片描述

import requests
from bs4 import BeautifulSoup

# 获取标签
r=requests.get("http://python123.io/ws/demo.html")
demo=r.text
soup=BeautifulSoup(demo,'html.parser')
print(soup.title) # title 网页的标题(左上方)
print(soup.a) # a 链接标签 如果有多个 则获取第一个
print(soup.a.name) # a标签的名字
print(soup.a.parent.name) # a标签父亲的名字 也就是包括a标签的上一层标签
print(soup.a.parent.parent.name) # 父亲的父亲

# 获取标签的属性
print(soup.a.attrs) # attrs:获取此标签下的所有属性
print(soup
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值