python查找指定字符index_在beautifulsoup / python中查找带有特定文本的标签的索引

最新推荐文章于 2021-10-02 23:49:02 发布

weixin_39674978

最新推荐文章于 2021-10-02 23:49:02 发布

阅读量340

点赞数

文章标签： python查找指定字符index

I have a simple 4x2 html table that contains information about a property.

I'm trying to extract the value 1972, which is under the column heading of Year Built. If I find all the tags td, how do I extract the index of the tag that contains the text Year Built?

Because once I find that index, I can just add 4 to get to the tag that contains the value 1972.

Here is the html:

Building	Type	Year Built	Sq. Ft.
R01	DWELL	1972	1166

For example I know that if my input is index 2 and my output is text of that tag Year Built, I can just do this:

from bs4 import BeautifulSoup

soup = BeautifulSoup(myhtml)

td_list = soup.find_all('td')

print td_list[2].text

But how do I use input of text Year Built to get output of index 2?

解决方案

If your table has a static scheme, it is better using row and column indexes. Try this:

rows = soup.find("table").find("tbody").find_all("tr")

print rows[1].find_all("td")[2].get_text()

Alternatively if you just want to find index number of the tag containing "Year Built":

from bs4 import BeautifulSoup

soup = BeautifulSoup(myhtml)

td_list = soup.find_all('td')

i = 0

for elem in td_list:

if elem.text == 'Year Built':

ind = i

i += 1

print td_list[ind].text

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39674978

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

wly476923083的博客

10-07

292

1、给定一个字符串，找到所有彼此相似的重复字符。 2、初始化测试字符串。在字符串上使用reduce方法，迭代字符串的每个字符并对字符串执行函数。 3、该函数检查字符串左侧和右侧的字符索引是否相同以及是否已在结果中。 4、如果任何字符满足上述条件，则将其添加到结果中。 5、打印结果。

python123文件字符分布_Python 基于狄利克雷分配（LDA）模型的中文分词示例

weixin_39785858的博客

12-21

705

时间：2019-02-19概述：中文分词Python 基于潜在狄利克雷分配(LDA)模型的内容主题挖掘，主要是中文分词技术的应用演示，依赖库：sys、tarfile、os、jieba、gensim、bs4，程序输入：article.txt、news_data.tar.gz，程序输出：打印输出18个主题及新文本的预测主题归属。# 导入库import sysreload(sys)sys.setdefa...

参与评论您还未登录，请先登录后发表或查看评论

python html解析查找字符串_python爬虫之html解析Beautifulsoup和Xpath

weixin_42657024的博客

01-12

631

BeautiifulsoupBeautiful Soup 是一个HTML/XML的解析器，主要的功能也是如何解析和提取 HTML/XML 数据。BeautifulSoup 用来解析 HTML 比较简单，API非常人性化，支持CSS选择器、Python标准库中的HTML解析器，也支持 lxml 的 XML解析器。Beautiful Soup 3 目前已经停止开发，推荐现在的项目使用Beautiful...

python查找指定字符index,在beautifulsoup / python中查找带有特定文本的标签的索引

weixin_39850167的博客

12-09

243

I have a simple 4x2 html table that contains information about a property.I'm trying to extract the value 1972, which is under the column heading of Year Built. If I find all the tags td, how do I ext...

python如何获取指定链接_python – Beautifulsoup – 如何使用某个类获取块内的所有链接？...

weixin_39670857的博客

11-29

594

我有以下HTML Dom： Разработчик Перейти на веб-сайтНаписать: info@jourist.comDiagonalstraße 4120537 Hamburg 我需要在块div.meta-info-wide中获取所有链接(url)和类dev-link.我尝试了这种显而易见的方法,但不起作用：divTag = soup.find_all("div", {...

python爬虫--beautifulsoup使用介绍

_____

12-19

1170

简单来说，Beautiful Soup是python的一个库，最主要的功能是从网页抓取数据。官方解释如下： Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱，通过解析文档为用户提供需要抓取的数据，因为简单，所以不需要多少代码就可以写出一个完整的应用程序。 Beautiful Soup自动将输入文档转换为Unicode编码，输...

python中beautifulsoup的作用_Python3中BeautifulSoup的使用方法

weixin_30641041的博客

01-14

4867

BeautifulSoup的使用我们学习了正则表达式的相关用法，但是一旦正则写的有问题，可能得到的就不是我们想要的结果了，而且对于一个网页来说，都有一定的特殊的结构和层级关系，而且很多标签都有id或class来对作区分，所以我们借助于它们的结构和属性来提取不也是可以的吗？所以，这一节我们就介绍一个强大的解析工具，叫做BeautiSoup，它就是借助网页的结构和属性等特性来解析网页的工具，有了它我们...

批量文本文件中查找字符串.rar

08-12

"批量文本文件中查找字符串"这个主题聚焦于如何在多个文本文件中高效地定位特定的字符串。下面将详细阐述这个过程涉及到的技术点和实现方法。首先，我们需要了解“批量”处理的概念。批量处理意味着我们要对一组...

BeaufulSoup获取特定标签下内容的方法

热门推荐

LivingStone的博客

05-19

6万+

以下是个人在学习beautifulSoup过程中的一些总结，目前我在使用爬虫数据时使用的方法的是：先用find_all()找出需要内容所在的标签，如果所需内容一个find_all()不能满足，那就用两个或者多个。接下来遍历find_all的结果，用get_txt（）、get('href')、得到文本或者链接，然后放入各自的列表中。这样做有一个缺点就是txt的数据是一个单独的列表，链接的数据也是一个单

Python使用BeautifulSoup提取特定HTML标签内容

SDUTACM的博客

08-23

1万+

将网页的HTML元代码down到本地，然后读取 #coding=utf-8 from bs4 import BeautifulSoup import datetime def getYesterdayTime(): now_time=datetime.datetime.now() yes_time = now_time + datetime.timedelta(da

BeautifulSoup获取包含某字符串的元素

weixin_37560085的博客

05-14

7883

取出含有某个字符串的所有标签 response = requests.get(url='https://www.cnbc.com/2017/12/14/the-bitcoin-holiday-gift-guide-including-diamond-earrings-travel-and-soap.html') soup = BeautifulSoup(response.text, 'h...

实现列表与表单的动画效果

Hambur_的博客

10-29

685

为列表添加动画效果需要在li标签外添加transition-group标签这里应注意为多行数据添加动画效果需要使用的标签时transition-group标签而不是transition标签并且由于transition-group标签默认tag为span标签，所以需要注意添加tag标签修改为ul并将原ul标签注释掉。最后在添加自己想要实现的动画效果在此基础上应该如何实现table表单的动画效果首先，想到的应该是标签的使用也是transition-group标签然后就需要考虑的是transiti

BeautifulSoup 利用Find_all（）多级标签索引和获取标签中的属性内容

learner_syj的博客

10-02

3万+

BeautifulSoup详解 BeautifulSoup是Python爬虫常用的一个库，起到解析页面的功能。但是我们课上的老师没有把这个库详细的讲，所以我利用网上的资源自己整合一下，写一篇Blog来学习一下~ 首先是BeautifulSoup库的安装：命令行运行: pip3 install beautifulsoup4 BeautifulSoup的解析器：我们常用html.parser解析器解析器使用方法优势 Python标准库 BeautifulSoup(response

beautifulsoup通过id获取指定元素内容

Lynn_coder的博客

03-10

4万+

<tr style="background-color:#fff;"> <td colspan="2" align=left valign="top"> <table id="zoom2" width="94%" border="0" cellspacing="0" cell

python soup findall 第几个元素_python从多个同类元素中定位指定某个

weixin_39702483的博客

12-08

724

满意答案12345678910111213141516171819202122232425262728#_*_coding:utf-8_*_frombs4importBeautifulSoupres=u'''.........text-align:center;width:715px;text-overflow:ell...

Python学习爬虫（4）--BeautifulSoup中Tag及NavigableSting详细介绍

weixin_31315135的博客

03-26

4037

作者：IT小样上一篇简单的举例了BeautifulSoup的初级使用，本篇详细介绍BeautifulSoup的深一级用法。

python 读取xml获取包含指定标签的数据_用Python元素提取XML的特定行

weixin_34706684的博客

02-20

1546

我有点困在我正在做的一个项目上，它使用Python——我对它非常陌生。我被告知使用ElementTree并从传入的XML文件中获取指定的数据。听起来很简单，但我不擅长编程。非常低(a！)一个传入文件的小例子以及我试图使用的代码。在我想知道下一步该怎么做。我试着搜索和跟踪别人做过的事情，但似乎没有得到相同的结果。我的目标是获取包含在“活动”、“房间”和“方向”中的信息，但稍后我将需要获得更多信息。在...