python3 文件解析模块（html,email等说明）

最新推荐文章于 2022-12-20 22:04:35 发布

liujun-st

最新推荐文章于 2022-12-20 22:04:35 发布

阅读量3.6k

点赞数

分类专栏： Python3

本文链接：https://blog.csdn.net/Ben_Ben_Niao/article/details/40540227

版权

Python3 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

1. python能解析很多文件，如解析日志模块logging,解析邮件模块email,解析html模块的html/HTMLParser,解析表格xls等xls.doc等，这些解析过程都很相似，主要明白一下几点：

第一，先了解文件里面的格式，一般都会有关键字符串，以html为例子，<html>和</html>之间为整个html的信息，里面包括头，在<head>和</head>之间。

<html>
 <head>
  <title> Python Html module </title>
  <meta name="Generator" content="EditPlus">
  <meta name="Author" content="Hongten">
  <meta name="Keywords" content="hongten,python">
  <meta name="Description" content="this blogs is about python">
 </head>

 <body>
    <table border = "1">
        <tr>
            <td>
            Author
            </td>
            <td>
            Hongten
            </td>
            <td>
            Mail
            </td>
            <td>
            hongtenzone@foxmail.com
            </td>
        </tr>
        <tr>
            <td>
            Blos
            </td>
            <td>
            <a href="http://www.blogs.com/hongten">http://www.blogs.com/hongten</a>
            </td>
            <td>
            QQ
            </td>
            <td>
            648719819
            </td>
        </tr>
    </table>
 </body>
</html>