爬虫前的小准备----BeautifulSoup

最新推荐文章于 2024-08-27 16:38:10 发布

乾杯 []~457

最新推荐文章于 2024-08-27 16:38:10 发布

阅读量2.9k

点赞数

分类专栏：爬虫文章标签： python 爬虫 html

本文链接：https://blog.csdn.net/qq_63536491/article/details/123831346

版权

爬虫专栏收录该内容

9 篇文章 0 订阅

订阅专栏

html = '''
<ul>
  <li><a href="xiaotian.com">小天</a></li>
  <li id="abc"><a href="zhoutian.com">周天</a>></li>
  <li><a href="zhu.com">朱</a></li>
  <li><a href="wu.com">吴</a></li>
  <a href="xiao.com">小</a>
</ul>
'''

1，导入

import requests

from bs4 import BeautifulSoup

2，通过url得到html文本

3，初始化 BeautifulSoup 对象

page = BeautifulSoup(html, "html.parser")  # "html.parser"解析器

4，用法：

4.1

4.2

4.3

find_all 是返回一个列表

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

乾杯 []~457

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫前的小准备----BeautifulSoup

html = '''<ul> <li><a href="xiaotian.com">小天</a></li> <li id="abc"><a href="zhoutian.com">周天</a>></li> <li><a href="zhu.com">朱</a></li> <li><a href="wu.com".
复制链接

扫一扫