html通过id查找标签,Python 爬虫 – 根据id与class查找标签

最新推荐文章于 2022-11-12 14:23:50 发布

弄獐相公李哥奴

最新推荐文章于 2022-11-12 14:23:50 发布

阅读量1k

点赞数

文章标签： html通过id查找标签

本章介绍怎么根据id与class查找标签。假设有下面的HTML文档：

A simple example page

First paragraph.

Second paragraph.

First outer paragraph.

Second outer paragraph.

可以通过URL https://kevinhwu.github.io/demo/python-scraping/simple2.html 访问上面的文档。让我们先下载页面并创建一个BeautifulSoup对象:

import requests

from bs4 import BeautifulSoup

page = requests.get("https://kevinhwu.github.io/demo/python-scraping/simple2.html")

soup = BeautifulSoup(page.content, 'html.parser')

根据class查找标签

根据id与class查找标签，使用的仍旧是find_all方法。下面的例子，查找类是outer-text的p标签：

soup.find_all('p', class_='outer-text')

[

First outer paragraph.

Second outer paragraph.

在下面的例子中，查找任何类是outer-text的标签:

soup.find_all(class_="outer-text")

[

First outer paragraph.

Second outer paragraph.

根据id查找标签

另外，也可以通过id查找标签:

soup.find_all(id="first")

[

First paragraph.

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

弄獐相公李哥奴

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python爬虫入门9：BeautifulSoup快速查找HTML内容

老猿Python

02-05

2080

本节介绍了BeautifulSoup查找类的主要方法，通过这些方法可以找到符合条件的html元素。本节文档老猿在BeautifulSoup官网的基础之上验证测试之后整理而成，文档结构大部分内容与官网内容，但有老猿验证之后的一些比较独特的内容。

python爬虫提取a标签_Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释

weixin_39593593的博客

11-24

865

一、Tag(标签)对象1.Tag对象与XML或HTML原生文档中的tag相同。from bs4 import BeautifulSoupsoup = BeautifulSoup('Extremely bold','lxml')tag = soup.btype(tag)bs4.element.Tag2.Tag的Name属性每个tag都有自己的名字，通过.name来获取tag.name'b'tag.n...

参与评论您还未登录，请先登录后发表或查看评论

[爬虫实战]利用python根据样本ID快速收集对应样本的相关信息

weixin_56070595的博客

11-05

489

最近，老师给翔哥安派了个活，按老师的要求是需要，由于需要收集的样本数量较多，手动收集的效率比较低下，奈何自己对爬虫又不是很熟，于是就找到了我，让我帮忙给他写个python爬虫来完成这个任务，下面记录整个解决过程，仅供参考。

标签id为字符串形式，如何通过该字符串寻找标签

总有那么一群人喜欢盯着我的博客看，估计这是他们见过最长的博客名，我必须得告诉他们博客名最长可以写多长

02-28

550

$("标签类型[id="+字符串+"]").内容 $("td[id="+idD+"]").css("background-color", "#ff6347");

html如何查找文件,如何查找网站上HTML的CLASS文件并下？如何查找网站上HTM 爱问知识人...

weixin_29326909的博客

06-10

359

安装设置步骤：1。从http://www。kpdus。com/jad。html 下载jadnt158。zip 。2。从http://jadclipse。sourceforge。net/ 下载net。sf。jadclipse_3。3。jar(对应eclipse3。3)3。将jadnt158。zip 解压，拷贝jad。exe 到%JAVA_HOME%\bin\ 目录下。4。安装插件net。sf...

python3学习（3）：ID 遍历爬虫

YZ520999的博客

06-29

198

从python3学习（2）中可知所有爬取的网站URL只有在结尾处有区别，因此，可以利用该弱点来遍历访问所有URL。 ### 二、 ID 遍历爬虫，利用网站结构的弱点，轻松访问所有内容。 # Downloading: http://example.webscraping.com/places/default/view/Afghanistan-1 # Downloading: h...

JQuery如何获取ID含有特殊字符的DOM元素

黄啊码

07-02

703

为业务需要，DOM元素的ID被命名为“c-order.range”，执行JQuery的DOM查询时，提示如下错误 Uncaught Error: Syntax error, unrecognized expression: [id=c-order.range] 1. 解决办法：document.getElementById 以前总觉得这个办法笨拙，现在越觉得此方法强大，几乎就是大杀器，没有查询不了的元素，无论你的元素ID命名多么刁钻。 var rowId = 'c-order.range', v..

Python爬虫第一课，选取标签内容

12-22

本教程将介绍Python爬虫的基础，特别是如何选取和解析HTML标签内容。我们将使用`urllib`库来发送HTTP请求，以及`BeautifulSoup`库来解析HTML文档。首先，我们需要导入必要的库： ```python # from urllib.request...

使用BeautifulSoup爬取想要的标签（《python网络爬虫权威指南》笔记）

12-21

`text`参数允许我们根据标签内的文本内容进行查找，而`limit`限制返回结果的数量，`keywords`则用于设置特定的属性，例如，当我们需要查询类属性时，由于`class`是Python的保留关键字，所以应写成`class_`。...

python获取div标签的id,Python：BeautifulSoup按其类提取div标签之间的字符串

weixin_32641817的博客

02-04

765

import urllib, urllib2from bs4 import BeautifulSoup, Commenturl='http://www.amazon.in/product-reviews/B00CE2LUKQ/ref=cm_cr_pr_top_link_1?ie=UTF8&showViewpoints=0&sortBy=bySubmissionDateDescend...

python--爬虫爬取html和txt文件

最新发布

weixin_45289656的博客

11-12

5059

python--爬虫爬取html和txt文件

day22 bs4基本用法

m0_71317179的博客

06-21

1509

BeautifulSoup9(网页数据，解析器名称) 网页数据 - 需要解析的网页代码解析器名称 - lxml html = open(‘data.html’,encoding=‘utf-8’).read()soup = BeautifulSoup(html,‘lxml’)soup对象.select(css选择器) - 在整个网页中，取css选择器选中的所有标签，返回值是列表，列表中的元素是标签 soup对象.selece_one(css选择器) - 在整个网页中，获取c

Python爬虫——BeautifulSoup，获取HTML中文档，标签等内容

Rain778的博客

09-24

7265

BeautifulSoup，获取HTML中文档，标签等内容

[DOM]获取元素：根据ID、标签名、HTML5新增的方法、特殊元素获取

「虚幻私塾」

09-11

2368

目录*+++

JavaScript 练手小技巧：原生JS获兄弟标签

九天翔龙的技术博客

12-07

1867

兄弟标签，就是同一个父标签下的同级标签，不包括目标标签自己。一般对兄弟标签的应用，有三种情况：找所有的哥哥标签，找所有的弟弟标签，找所有的兄弟标签。原生的JS，只提供了nextElementSibling、previousElementSibling 两个找兄弟标签的属性，还只能找【紧邻】的标签。所以，要找兄弟标签，还需要自己封装函数。 let item3 = document.getElementById("item3"); // 找所有的【哥哥】标签 function preSilin.

根据html标签的属性找节点

一点一滴

11-12

2629

一、通过html元素的标签属性找节点： 1、常用方法： 1）document.getElementById(“html元素的id”) 2）document.getElementsByTagName(“标签名”) 3）document.getElementsByName(“html元素的name”)<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 T

如何遍历获得div里面所有a标签，并为每一个div添加自增的id和对应的事件