# BeautifulSoup # 灵活方便的网页解析 # pip3 install BeautifulSoup4 # 用法讲解 # lxml html 解析 # lxml XML 解析 # html5lib 解析 # BeautifulSoup from bs4 import BeautifulSoup soup = BeautifulSoup(html,'lxml') print(soup.prettify()) #自动补全HTML代码 print(soup.title.string) #获取里面的内容 标签选择器#############################################3 from bs4 import BeautifulSoup soup = BeautifulSoup(html,'lxml') print(soup.title) print(type(soup.title)) print(soup.head) print(soup.p) ####################### 获取名称 from bs4 import BeautifulSoup soup = BeautifulSoup(html,'lxml') print(soup.title.name) #打印出title名字 ###################333 获取属性 from bs4 import BeautifulSoup soup = BeautifulSoup(html,'lxml') print(soup.p['name']) 获取内容 from bs4 import BeautifulSoup soup = BeautifulSoup(html,'lxml') print(soup.p.string) #获取里面的内容 嵌套选择 from bs4 import BeautifulSoup soup = BeautifulSoup(html,'lxml') print(soup.head.title.string) 子节点和子孙节点 from bs4 import Be
python中BeautifulSoup库详解,网页分析,安装、使用、分享学习
最新推荐文章于 2024-08-21 16:44:17 发布
本文详细介绍了Python中的BeautifulSoup库,包括安装、基本用法、各种解析器的选择,如lxml和html5lib。内容涵盖了解析HTML和XML,选择器的使用,如获取标签、属性、内容以及子节点、父节点和兄弟节点的关系。还讨论了通过属性和文本内容进行查找,以及如何利用CSS选择器进行高效选择。是一篇深入学习BeautifulSoup的实用教程。
摘要由CSDN通过智能技术生成