python练习程序（得到HTML文件的title）

最新推荐文章于 2024-07-29 02:32:41 发布

weixin_34082695

最新推荐文章于 2024-07-29 02:32:41 发布

阅读量1k

点赞数

文章标签： python javascript ViewUI

原文链接：http://www.cnblogs.com/tiandsp/archive/2012/06/14/2549147.html

版权

from HTMLParser import HTMLParser
import sys

class TitleParser(HTMLParser):
    def __init__(self):
        self.title = ''
        self.readingtitle=0
        HTMLParser.__init__(self)

    def handle_starttag(self, tag, attrs):
        if tag == 'title':
            self.readingtitle=1

    def handle_data(self, data):
        if self.readingtitle:
            self.title +=data

    def handle_endtag(self, tag):
        if tag == 'title':
            self.readingtitle=0

    def gettitle(self):
        return self.title

fd=open(sys.argv[1])
tp=TitleParser()
tp.feed(fd.read())
print "Title is: ", tp.gettitle()