BeatifulSoup的使用

最新推荐文章于 2023-07-17 22:44:13 发布

浮萍此生

最新推荐文章于 2023-07-17 22:44:13 发布

阅读量441

点赞数

本文链接：https://blog.csdn.net/weixin_43723326/article/details/103696162

版权

一、导入包命令

from bs4 import BeautifulSoup

二、使用于requests库的结果

res = BeautifulSoup(req.text, “lxml”)

三、重要方法

find：返回第一个找到的结果，没有返回None
find_all: 返回一个列表，没有就返回空列表

四、根据id获取某个标签下所有内容

```
res = BeautifulSoup(req.text, "lxml")
# print(res)
box = res.find(id="column2")
```

五、根据class获取某个标签下所有内容

res = BeautifulSoup(req.text, "lxml")
	# print(res)
	box = res.find(_class="column")

注意这里class前面必须加符号"_"

六、使用name获取某个标签下所有内容

ul = box.find_all(name="ul")
	for i in ul:
		li = i.find_all("li")

一般情况下如果不是id也不是class，就可以使用“name”属性，比如常见的ul、li
注意循环获取下一级

获取某个标签属性值

my_href = j.find(name="a")["href"]

获取a标签的href属性值

获取某个标签文本

j.find(name="a").get_text():

获取a标签下的文本

以上用法可以完成BeatifulSoup 90%以上的工作

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

浮萍此生

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Beatiful Soup

weixin_45827692的博客

12-01

7331

一、简介 Beautiful Soup 自动将输入文档转换为Unicode编码，输出文档转换为“uft-8”编码。 Beautiful Soup 提供一些简单的，python函数来处理导航、探索、修改分析树等功能。二、基本用法案列 from bs4 import BeautifulSoup html=''' <html><head><title> 豆瓣电影 </title></head&g...

python beautiful soup库的用法

weixin_34127717的博客

03-09

3125

参考：http://cuiqingcai.com/1319.html Beautiful Soup 4.2.0 文档 1. Beautiful Soup 简介简单来说，Beautiful Soup是python的一个库，最主要的功能是从网页抓取数据。官方解释如下： Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索...

参与评论您还未登录，请先登录后发表或查看评论

爬知乎了解BeautifulSoup用法

wanghandou的博客

10-24

1054

import requests from bs4 import BeautifulSoup import time def captcha(captcha_data): with open("captcha.jpg","wb") as f: f.write(captcha_data) text=raw_input(("请输入验证码:").encode("gb18030")) retur

Python常用的几个解析库的学习整理。BeautifulSoup。

07-09

685

这将会是一系列的文章，整理自己之前学习爬虫的各个模块，只是粗略的过一下，介绍部分简单实例。从接触python爬虫到现在，基本上用过了所有常用的解析库。 lxml,BeautifulSoup,pyquery。当然了，还有re。个人认为前端基础比较扎实的，用pyquery是最方便的，当然了，beautifulsoup也不错，re速度比较快，但是写正则比较麻烦。 lxml的速度也是...

Beautiful Soup的使用

Huangqingmeng的博客

04-07

667

使用Beautiful Soup 对于一个网页来说，都有一定的特殊结构和层次关系，而且很多节点都有id或class属性来做区分，所以我们也可以借助它们的结构和属性来进行数据提取。简介简单来说，Beautiful Soup就是Python的一个HTML 或 XML的解析库，可以用它来方便的从网页中来提取数据。利用它可以省去很多繁琐的提取工作，提高了工作效率。解析器 Beautiful Soup 在解析时实际上依赖于解析器，它除了支持Python标准库中的HTML解析器外，还支持一些第三方解析器（比如lx

python 爬虫beatifulsoup使用例子

12-04

python 爬虫beatifulsoup使用例子，爬取姓名信息并且转化为拼音写入文本

beatifulsoup库使用

qq_28674411的博客

03-14

413

管理员权限安装库文件 pip install beautifulsoup4 如果出现报错： OSError: raw write() returned invalid length 2 (should have been between 0 and 1) 需要安装 pip install win_unicode_console 在进行操作即可：安装成功如下： C:\WINDO...

python爬虫必备BeatifulSoup4

01-26

BeautifulSoup库可以与多种解析器配合使用，如Python标准库中的解析器HTMLParser，以及第三方库lxml等，从而提供不同的解析速度和标准的兼容性。知识点一：安装与导入要使用BeautifulSoup，首先需要安装它。这...

python3个人爬虫之:BeautifulSoup学习心得

chenzao123的博客

03-01

880

一 Beautiful Soup的介绍官网介绍：Beautiful Soup是一个可以从HTML或者XML文件中提取数据的Python库，能够通过你喜欢的转换器实现惯用的文档导航，查找，修改文档的方式，Beautiful Soup 会帮你节省数小时甚至数天的工作时间。简而言之：就是一种强大的解析工具，帮助我们从网页中提取数据时提高效率。【tips】: BeautifulSoup...

Beautiful Soup 基本使用方法

热门推荐

songshao の blog

06-06

6万+

我们就来介绍一个强大的解析工具Beautiful Soup，它借助网页的结构和属性等特性来解析网页。有了它，我们不用再去写一些复杂的正则表达式，只需要简单的几条语句，就可以完成网页中某个元素的提取。 1、简介简单来说，Beautiful Soup就是Python的一个HTML或XML的解析库，可以用它来方便地从网页中提取数据。官方解释如下： Beautiful Soup提供一些简单的、Py...

Beautifulsoup的常规用法总结

sydney__的博客

07-20

1149

关于beautiful soup官方解释为：Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间. 1.首先来看一下用该库解析下来的效果对比这是官网上的源代码及其格式当我运行一下代码时解析该网站时格式如下可以看...

【爬虫】BeatifulSoup用法

weixin_44727383的博客

03-14

289

BeautifulSoup笔记： find_all的使用：在提取标签的时候，第一个参数是标签的名字。然后如果在提取标签的时候想要使用标签属性进行过滤，那么可以在这个方法中通过关键字参数的形式，将属性的名字以及对应的值传进去。或者是使用attrs属性，将所有的属性以及对应的值放在一个字典中传给attrs属性。有些时候，在提取标签的时候，不想提取那么多，那么可以使用limit参数。限制提取多少个...

浅谈Python爬虫之BeautifulSoup模块

m0_64816081的博客

02-06

897

前言 BeautifulSoup是主要以解析web网页的Python模块，它会提供一些强大的解释器，以解析网页，然后提供一些函数，从页面中提取所需要的数据,目前是Python爬虫中最常用的模块之一。安装库在使用前需要安装库，这里建议安装bs4，也就是第四版本，因为根据官方文档第三版的已经停止更新。同时安装lxml解释器 pip3 install bs4 pip3 install lxml 导入库 from bs4 import Beauti...

beautifulSoup详解

weixin_45203459的博客

10-17

2058

BeautifulSoup Beautiful Soup和lxml、html6lib同样作为python解释器，为用户灵活地提供不同的解析策略或强劲的速度。BeautifulSoup是一个工具箱,通过解析文档为用户提供需要抓取的数据,操作简单，代码简洁能自动补全代码中确实的标签第一种用法创建 beautifulsoup 对象： soup=BeautifulSoup(html,‘lxml’) ...

BeautifulSoup库

萨丁

09-02

527

python3爬虫学习笔记 BeautifulSoup 基本使用 html = ''' <html><head><title>The Dormouse's story</title></head> <body> <p class="title" name="dromouse"><b>The Dormou...

BeatifulSoup学习

chunxiangpei9232的博客

05-27

110

Tag对象 soup = BeautifulSoup('<b class="boldest">Extremely bold</b>') tag = soup.b type(tag) # <class 'bs4.element.Tag'> b就是一个tag...

Python爬虫学习笔记（六）————BeautifulSoup（bs4）解析