我想删除一堆.html文件中的所有内部链接。其基本思想是,任何以
我正试图编写一个小Python脚本来实现这一点。现在每个文件的前半部分都做得很好,但它总是在同一个链接上崩溃。很明显,我检查了是否有错别字或丢失了
,但我没有看到任何错误。如果我重新运行脚本,“问题链接”将被删除,但它的仍保留在。似乎越来越多的链接通过重新运行脚本被删除,但我希望所有的内部链接在一次运行中被切掉。在有人能告诉我我做错了什么吗?请看下面我使用的代码。在tList = [r"D:\@work\projects_2013\@websites\pythonforspss\a44\@select-variables-having-pattern-in-names.html"]
for path in tList:
readFil = open(path,"r")
writeFil = open(path[:path.rfind("\\") +1] + "@" + path[path.rfind("\\") + 1:],"w")
flag = 0
for line in readFil:
for ind in range(len(line)):
if flag == 0:
try:
if line[ind:ind + 8].lower() == '") + 1]
line = line.replace(link,"")
print link
except:
pass
if flag == 1:
try:
if line[ind:ind + 4].lower() == '':
flag = 0
line = line.replace('',"")
print ""
except:
pass
writeFil.write(line)
readFil.close()
writeFil.close()