朋友给我发了一些文章,是HTML格式的。但是我的A1200手机只适合看txt格式的书,所以写了一个脚本,把某个目录下的所有.htm文件转换成txt,并放到txt目录下。
1 from formatter import AbstractFormatter, NullWriter
2 from htmllib import HTMLParser
3
4 def _(str, in_encoder="gbk", out_encoder="utf8"):
5 return unicode(str, in_encoder).encode(out_encoder)
6
7
8 class