python修改html的<td>_如何从htmltd标记中除去python中rowspan之外的所有属性？

最新推荐文章于 2023-06-14 17:06:52 发布

宛丘之

最新推荐文章于 2023-06-14 17:06:52 发布

阅读量477

点赞数

文章标签： python修改html的<td>

本文链接：https://blog.csdn.net/weixin_42365170/article/details/113504713

版权

使用Python3.3我试图制作一些正则表达式替代品，但没有成功。在

我想去掉td标记的所有属性，除了rowspan属性(末尾的示例td)。在

当rowspan存在时，我可以使用以下命令成功替换：re.sub('(

]*([\\s]rowspan[\\s]*=[\\s]*[0-9]*)[^>]*(>)', handle_td, file_contents)

其中handle_td是：

^{pr2}$

但我还想处理剩下的td，这是我没有做到的。在

如果我在第二个组之后添加?，它将td标记更改为，并且不保留rowspan属性。在

我做错什么了？我该怎么解决这个问题？

我没有运行另一个命令来处理另一个td的，但我没有管理…

这将产生：

我是这样做的(如果您有更好的方法，请随意添加它)：# Leave only specific attributes for td tags

def filter_td_attributes(matchobj):

if matchobj.group(1) == "rowspan":

return matchobj.group(1) + '=' + matchobj.group(2)

# Loop the attributes of the td tags

def handle_td(matchobj):

new_td = re.sub("([a-zA-Z]+)[\\s]*=[\\s]*([a-zA-Z0-9:;.\\-'\\s]*)([\\s]|>)", filter_td_attributes, matchobj.group(0))

new_td = re.sub("[\\s]*$", '', new_td)

new_td = new_td + ">" # close the td tag

return new_td

file_contents = re.sub('[\\s]*

[\\s]*', '', file_contents)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

宛丘之

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

用 Python 生成 HTML 表格

jishulaozhuanjia的博客

03-18

1784

个人博客导航页（点击右侧链接即可打开个人博客）：大牛带你入门技术栈在邮件报表之类的开发任务中，需要生成HTML表格。使用Python生成HTML表格基本没啥难度，for循环遍历一遍数据并输出标签即可。如果需要实现合并单元格，或者按需调整表格样式，就比较麻烦了。这时，可以试试本文的主角 ——html-table包，借助它可生成各种样式的HTML表格。 ...

HTML表格

jcf52的博客

03-21

1608

实际生活中，我们经常使用到表格来统计数据和信息，这样可以更加清晰地显示数据或信息，表格是一个二维数据空间，一个表格由若干行组成，一个行又有若干单元格组成，单元格里可以包含文字、列表、图案、表单、数字符号、预置文本和其它的表格等内容。表格最重要的目的是显示表格类数据。表格类数据是指最适合组织为表格格式（即按行和列组织）的数据。一，表格的基本结构 1.标签每个表格有三个必须的标签，<table>、<tr>和<td>三个标签，用来创建表格，语法结构如下： &lt

参与评论您还未登录，请先登录后发表或查看评论

python修改html的<td>_Python有条件地将类添加到< td> HTML表中的标签

weixin_39895481的博客

12-10

177

I have some data in the form of a csv file that I'm reading into Python and converting to an HTML table using Pandas.Heres some example data:name threshold col1 col2 col3A 10 12 9 1...

正则表达式去除html标签的所有属性

最新发布

hello world

06-14

535

想要将标签的所有属性去除，只留下。

html之colspan && rowspan讲解

weixin_34400525的博客

04-13

142

1.colspan && rowspan均在td标签中使用 2.每个单元格大小一致的前提 <table border="1" bordercolor="red"><tr> <td>nokiacomputer</td> <td>nokiacomputer</td&a

python去除html标签

狂徒技术分享

08-07

250

from HTMLParser import HTMLParser str=”<td>nihao</td><a href=’http://baidu.com’>hi</a>” def strip_tags(html): html=html.strip() html=html.strip(”\n”) result=[] pa...

python rowspan_通过jquery还原含有rowspan、colspan的table的实现方法

weixin_39702479的博客

12-16

130

需求把含有rowspan、colspan的table还原。例如原table为：还原后的table为：代码原理对table进行遍历，如果td的rowspan属性值大于1，则给当前的td的父元素的兄弟元素添加td，如果td的colspan属性值大于1，则在当前的td元素后添加td代码如下://本文首发博客园:http://artwl.cnblogs.com(2012/02/08)jQuery.fn.R...

python：SGMLParser-巧妙从html文件中取到所需数据

tomorrownan的博客

11-23

1413

SGMLParser是sgmllib的一个类，使用的时候我们只需要重载这个类，并在子类中对html文件做具体处理即可。用自己的方法覆盖原有的方法，这样我们可以从html网页文件中轻松取到想要的数据，然后写进自己定义的数据结构中，便于在前端使用这些数据。 SGMLParser 可以把 HTML 分解成有用的片段，比如开始标记start_tagname(self, attrs)和结束标记end_ta...

HTML 知识点总结

qq_44124656的博客

01-03

2438

一、HTML简介 HTML 俗称网页，就是我们打开浏览器访问任何一个网站所看到的都是由 HTML 页面提供的（或者与 HTML 技术相关的内容提供）。人-普通人超人 HTML 全称为 HyperText Markup Language，被译为超文本标记语言。所谓的超文本就是不仅只有文本内容，包括链接、音频和视频、图像等内容。所谓标记语言，简单来说就是元素。也就是说，HTML 提供一系列的元素...

【Web知识点】------ HTML

qq_41543825的博客

04-11

1421

【Web知识点】HTML 文章目录【Web知识点】HTML一、HLML （超文本标记语言）1、什么是HTML2、怎么学HTML3、开发工具二、HTML常用标签1、标签定义2、标签、标签属性3、标签分类4、块级标签（4个）5、行内标签（4个）5、行内元素、块级元素的相互转换（样式修改）三、HTML特殊符号1、特殊符号2、特殊符号代码四、HTML表格1、概念2、HTML表格五、HTML表单``````(常用)1、概念2、应用3、HTML表单六、web小案例（用户注册页面）1、效果2、代码一、HLML （超文本

python去除html空格

04-16

750

如下面的 1 <td> 柳暗花溟</td> html里面的空格&nbsp，想直接用strip()函数去除是不可能的，必须显式的去掉\xa0 例如以上的就可以这样的方式去除空格 1 author = author.strip("\n\r \xa0") 记录一下。转载于:https://www.cnb...

python爬虫正则匹配td标签中的内容,以及一些常用的正则

热门推荐

u014052851的博客

08-03

1万+

python正则匹配td标签中的内容,以及一些常用的正则

python rowspan_python HTML展示表格数据（有合并的单元格)

weixin_39661881的博客

12-16

501

展开全部拷贝一下代码并保存到本地，然后运行它，再打开那个Demo的链接就可以看到效果e69da5e887aa62616964757a686964616f31333363373163了#!/usr/bin/envpython3fromcollectionsimportOrderedDictfromos.pathimportdirname,abspath,joinasjoinpa...

关于table排版

weixin_30466421的博客

07-29

889

colspan和rowspan这两个属性用于创建特殊的表格。 colspan是“column span（跨列）”的缩写。colspan属性用在td标签中，用来指定单元格横向跨越的列数：在浏览器中将显示如下：单元格1 单元格2 单元格3 单元格4 该例通过把colspan设为“3”, 令所在单元格横跨了三列。如果我们将colspa...

python rowspan_Python tkinter rowspan未正确调整元素大小

weixin_39738667的博客

12-16

693

我正在编写一个定制的Python类，它简化了与tkinter的交互，因此我可以简化编写自己的GUI应用程序的过程。到目前为止，这是一个棘手的问题，但进展是稳定的，而且效果很好。然而，我遇到了一些特殊的意外行为，我无法找出原因。当我将元素定义为具有行跨度时，它不会展开以适合我指定的行数。以下是我当前输出的屏幕截图：截图中的GUI按指定的顺序定义：在单元格0,0-0,10中，10个标签定义为“1”到“...

python修改html表格,用Python生成HTML表格

weixin_30624185的博客

06-03

1757

在邮件报表之类的开发任务中，需要生成HTML表格。使用Python生成HTML表格基本没啥难度，for循环遍历一遍数据并输出标签即可。如果需要实现合并单元格，或者按需调整表格样式，就比较麻烦了。这时，可以试试本文的主角 ——html-table包，借助它可生成各种样式的HTML表格。接下来，以一个简单的例子演示html-table的常用用法：开始之前，须通过p...

Python 爬虫使用正则去掉不想要的网页元素

aini4568的博客

03-20

750

在做爬虫的时候，我们总是不想去看到网页的注释，或者是网页的一些其他元素，有没有好的办法去掉他们呢？例如：下面的问题第一种情况<ahref="http://artso.artron.net/auction/search_auction.php?keyword=%E6%9E%97%E7%BB%8D%E5%91%A8"target="_blank">林绍周（明）<...

table下td的属性colspan和rowspan

Waite的博客

04-18

4999

colspan和rowspan这两个属性用于创建特殊的表格。colspan用来指定单元格横向跨越的列数：colspan就是合并列的，colspan=2的话就是合并两列。rowspan用来指定单元格纵向跨越的行数:rowspan就是用来合并行的，比如rowspan=2就是合并两行，...

HTML教程：单元格<td>与<th>属性解析

"这篇教程详细介绍了HTML网页设计中单元格标签`<td>`和`<th>`的属性，以及HTML的基础知识。HTML全称为超文本标记语言，是一种用于创建超文本文档的语言，允许集成多媒体内容如图片、声音等。HTML文档本身是静态的，...