bs4的学习

最新推荐文章于 2024-01-23 17:55:23 发布

baodao9225

最新推荐文章于 2024-01-23 17:55:23 发布

阅读量109

点赞数

文章标签： python

原文链接：http://www.cnblogs.com/ZHANG576433951/p/6118629.html

版权

soup = BeautifulSoup(html,'html.parser') #'html.parser'是html解析器必须有


soup.find_all("a")  #等价于 soup("a")
soup.find("a") #等价于 soup.a


soup.p  得到的是文档中的第一个p标签
soup.find_all要想得到所有标签p标签

print soup.p.get_text()生成一个文本，只是第一个标签

用css查找
print soup.find_all("a", class_="sister") #注意写法的形式
查找结果<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>


学习网址http://wiki.jikexueyuan.com/project/python-crawler-guide/beautiful-soup.html