如何将html转换成url,如何将html文件的链接更改为本地链接

我正在Python2.7上制作我自己的网络爬虫程序,它将网站下载到我计算机中的某个路径上,然后我以类似的方式保存文件,它们保存在服务器上站点的文件夹中,例如:

我将在它里面的stackoverflow目录一个问题的目录,在它里面这个页面的html文件。。。在

如果我的电脑上已经有这些网页,我如何才能将这些网页的链接更改为链接到我下载的网页?在

例如,如果有:

所以我将通过python将这个html代码更改为

或类似的。。在

我不知道它是否有用,但我用这个功能下载到一个文件上:

def下载文件(路径,url):try :

print "Downloading : " + url

path=path + urlparse(url).path

path , fileName = pathNameSplit(path)

make_sure_path_exists(path)

print "trying to downoad " + fileName

if (fileName.count(".") == 0 ):fileName = fileName + ".html"

#pickle.dump( url2Html(url) , open( path + fileName, "w" ))

urllib.urlretrieve(url, path + fileName)

print "Download of " + url + " Completed"

except Exception:

print "Sometihng occured in the download of " + url

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值