SGMLparser处理过程:
so simple
begin, like unknown_starttag(self,tag,attrs),then handle_data(self,text)
then cursive
需要注意:网页只解析一遍,标签有许多,所以会出现比较多的同类结果
SGMLparser处理过程:
so simple
begin, like unknown_starttag(self,tag,attrs),then handle_data(self,text)
then cursive
需要注意:网页只解析一遍,标签有许多,所以会出现比较多的同类结果