识别HTML格式标题并自动生成MarkDown目录Python程序

HIT-Zxy

已于 2023-12-11 21:19:14 修改

阅读量388

点赞数 7

分类专栏：尝试用python实现一些小功能文章标签： python

于 2023-12-09 15:07:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2201_76050457/article/details/134895526

版权

尝试用python实现一些小功能专栏收录该内容

2 篇文章 0 订阅

订阅专栏

"""自己编写的识别HTML格式标题并自动生成目录的程序"""
import re

# 正文内容放在这里
Test_text = r"""
"""

# 获取标题格式<hx XX>x.x xx</hx>，支持多行（re.MULTILINE）
get_title_pattern = re.compile(r'\<h.*?\>.*?\</h\d\>', re.MULTILINE)

# 找到全部符合标题格式的字符串，也就是标题语句
get_title_result = get_title_pattern.findall(Test_text)

# 准备去掉头尾
del_edge_result = ''

# 将标题语句列表整合到一个字符串中
if get_title_result:
  for title_outturn in get_title_result:
    del_edge_result += title_outturn

  # 获取头尾格式 <hx XX> 和 </hx>
  get_head_pattern = re.compile(r'\<h.*?\>',re.MULTILINE)
  get_end_pattern = re.compile(r'\<\/h\d\>',re.MULTILINE)

  # 将开头替换为'['，末尾替换为'](#)|'
  del_head_result = get_head_pattern.sub('[', del_edge_result)
  del_end_result2 = get_end_pattern.sub('](#)|', del_head_result)

  # 分割模式：以竖线 | 分割
  split_pattern = re.compile(r'\|')

  # 使用split函数分割
  split_result = split_pattern.split(del_end_result2)

  # 将分割内容前添加'* '输出
  for catalog_outturn in split_result:
    find_dot = ''
    # 按照标题等级为*前添加空格
    for i in range(len(catalog_outturn)):
      if catalog_outturn[i] != ' ':
        find_dot += catalog_outturn[i]
      else:
        dot_count = find_dot.count('.')
        if catalog_outturn[i-1] == '.':
          dot_count -=1
        break
    if catalog_outturn:
      print(' '*(dot_count-1)*2+'* '+catalog_outturn)
else:
  print("未找到标题语句！")

关注

7
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

HIT-Zxy CSDN认证博客专家 CSDN认证企业博客

码龄2年

哈尔滨工业大学

14: 原创

147万+: 周排名

28万+: 总排名

1万+: 访问

: 等级

377: 积分

176: 粉丝

217: 获赞

8: 评论

229: 收藏

私信

关注

热门文章

分类专栏

我的Python学习日记 11篇
尝试用python实现一些小功能 2篇

最新评论

Conda基本命令简记
CSDN-Ada助手: 恭喜您撰写了第14篇博客！标题“Conda基本命令简记”听起来很有趣。您的持续创作令人钦佩。对于下一步的创作建议，也许您可以考虑分享一些实际案例，例如如何在项目中使用Conda命令解决特定的问题。这样的内容会进一步丰富读者的知识，并为他们提供更多有用的指导。谦虚之余，期待您未来更多的文章！
用自动化工具selenium批量获取油管播放列表内视频的url
CSDN-Ada助手: 恭喜您写了第12篇博客！用selenium批量获取油管播放列表内视频的url听起来非常厉害。不过，我想提个建议，下一步可以尝试分享一些关于如何利用这些url进行数据分析或者其他有趣的应用。期待您的下一篇博客！加油！
我的Python学习日记（九）：错误和异常
CSDN-Ada助手: 亲爱的作者，恭喜你写下了第9篇博客！学习Python并不容易，但你坚持不懈地记录学习日记，这种毅力值得赞扬。关于错误和异常的主题很重要，希望你能继续分享你的学习心得和解决问题的方法。对于下一篇博客，我建议你可以探讨一些常见的错误和异常，并分享一些实用的调试技巧。期待你的下一篇文章！加油！
我的Python学习日记（七）：Module 模块
CSDN-Ada助手: 恭喜您写了第7篇博客！标题“我的Python学习日记（七）：Module 模块”非常引人注目。您的博客内容一直都很有深度和见解，我对您的学习态度和持续创作精神表示钦佩。在接下来的创作中，或许您可以考虑探索一些与Python模块相关的进阶主题，比如模块的导入，常用的内置模块等等。这些主题会进一步拓宽您的知识领域，并为读者提供更多有用的信息。期待您在未来继续分享您的学习心得，我相信您将会取得更大的进步！加油！
我的Python学习日记（六）：函数
CSDN-Ada助手: 恭喜你写了第6篇博客！看到你持续创作的努力，我真是非常欣慰。通过你的学习日记，我不仅能够了解到函数的基本概念，还能感受到你对Python学习的热情。接下来，我建议你可以尝试写一些实例代码，通过实际操作来加深对函数的理解。希望你能继续保持学习的劲头，期待你的下一篇博客！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

HIT-Zxy 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。