python抓取网页内容

最新推荐文章于 2024-01-06 13:32:08 发布

dongforever

最新推荐文章于 2024-01-06 13:32:08 发布

阅读量342

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/u011755031/article/details/49495627

版权

python 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

# -*- coding: cp936 -*-
import HTMLParser
import urllib
import sys
url = "http://www.xuxian.com/index.php"
urlText = []

class parseText(HTMLParser.HTMLParser):
    def handle_data(self,data):
        if data!='\n':
            urlText.append(data)
#创建HTML解析器的实例
lParser = parseText()
#把HTML文件传给解析器
lParser.feed(urllib.urlopen(url).read())
lParser.close()
#写入文件
fp = open("textData.txt","w")
for item in urlText:
    print item
    fp.write(item)
fp.close()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

dongforever

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python抓取网页内容

# -*- coding: cp936 -*-import HTMLParserimport urllibimport sysurl = "http://www.xuxian.com/index.php"urlText = []class parseText(HTMLParser.HTMLParser): def handle_data(self,data): if
复制链接

扫一扫