如何将特殊标签或节点的数据取出来。
可以通过BeautifulSoup中的select方法。
例子
from bs4 import BeautifulSoup html_sample = '\ <html>\ <body>\ <h1 id="title">hell0 world</h1>\ <a href="#" class="link">This is link1</a>\ <a href="# link2" class="link">This is link2</a>\ </body>\ </html>' soup = BeautifulSoup(html_sample, 'html.parser') alink = soup.select('h1') #通过上面获取页面数据,取得所有h1标签的数据保存到列表中 print(alink) print(alink[0].text) #每个h1标签就是列表中的一个值,可以通过alink[0]获取第一个h1的全部数据,通过alink[0].text将h1标签中的内容取出来 alink1 = soup.select('a') #通过BeautifulSoup中的select方法获取页面数据中标签的内容 for link in alink1: #通过for循环将列表中的数据都输出出来 print(link) print(link.text)运行结果
[<h1 id="title">hello world</h1>]
hello world
<a class="link" href="#">This is link1</a>
This is link1
<a class="link" href="# link2">This is link2</a>
This is link2