python处理文本_Python 文本解析器

一、项目介绍

本教程讲解一个使用 Python 来解析纯文本生成一个 HTML 页面的小程序。

二、相关技术

Python:一种面向对象、解释型计算机程序设计语言,用它可以做 Web 开发、图形处理、文本处理和数学处理等等。

HTML:超文本标记语言,主要用来实现网页。

三、项目截图

纯文本文件:

5244466b6e0c98cf87e39bd2aeb51ac790e7790f.png

解析后生成的 HTML 页面如下图

bea39b7025af201fe70998485c4691201ba67b18.png

四、项目讲解

1. 文本块生成器

首先我们需要有一个文本块生成器把纯文本分成一个一个的文本块,以便接下来对每一个文本快进行解析,util.py 代码如下:

88dd0848ddd12731ef888ae95afe62d6e1dbfaaf.png

2. 处理程序

通过文本生成器我们得到了一个一个的文本块,然后需要有处理程序对不同的文本块加相应的 HTML 标记,handlers.py 代码如下:

711d821c1c2c9de8b11c6db7eea654e9c76649f7.png

b6f4eb7920c011ed6f46906e06e2421944914628.png

d15525a186cea0bd6601b85f43df4694c93819d4.png

3. 规则

有了处理程序和文本块生成器,接下来就需要一定的规则来判断每个文本块交给处理程序将要加什么标记,rules.py 代码如下:

7c4c1c6bbed81e15abc9d13e497e622ea45b7954.png

5e1a3b89ce351e55946069d3a4c29960bbe621eb.png

4. 解析

最后我们就可以进行解析了,markup.py 代码如下:

c577bffdf59ed639070e1c828b3a0bb954ad839b.png

eccea124394fa3ef131aa44aea020f40bd74d11a.png

运行程序(纯文本文件为 test.txt,生成 HTML 文件为 test.html)

deff06631e05848e41a83438ccc9304d7eade962.png

五、小结

在这个小程序中,我们使用了 Python 来解析纯文本文件并生成 HTML 文件,这个只是简单实现,通过这个案例大家可以动手试试解析 Markdown 文件。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值