# -*- coding: cp936 -*-
import HTMLParser
import urllib
import sys
url = "http://www.xuxian.com/index.php"
urlText = []
class parseText(HTMLParser.HTMLParser):
def handle_data(self,data):
if data!='\n':
urlText.append(data)
#创建HTML解析器的实例
lParser = parseText()
#把HTML文件传给解析器
lParser.feed(urllib.urlopen(url).read())
lParser.close()
#写入文件
fp = open("textData.txt","w")
for item in urlText:
print item
fp.write(item)
fp.close()
python抓取网页内容
最新推荐文章于 2024-01-06 13:32:08 发布