网页中可能会因为各种原因被插入恶意代码,比如弹窗之类的代码,会导致正常的网页在使用中无限次被弹窗广告骚扰,我们可以根据弹窗的标签来定位,然后删除弹窗代码:
例如,被插入恶意代码的html网页:
其中,被插入的恶意代码是:
<script language="JavaScript">{
var xmldoc = new ActiveXObject("MSXML2.DOMDocument.3.0");
xmldoc.load("<root><child></child></root>");
alert(xmldoc.xml);
}
</script>
<script language="JavaScript">
alert("hello world");
</script>
这一部分代码的作用是在网页中以弹窗的形式显示:
则,为了方便检查,也为了可以便捷的删除恶意代码,则可以使用如下的python代码:
import os
#获取templaters目录的路径
curr_path=os.getcwd() #获取当前目录
templaters_path=os.path.join(curr_path,'templaters') #使用join函数拼接得到templaters目录路径
#使用os.listdir()函数获取指定目录中的文件和文件夹
all_files=os.listdir(templaters_path)
#遍历所有文件
for file in all_files:
path=os.path.join(templaters_path,file) #使用join函数拼接得到file的完整路径
openfile=open(path,'r') #以只读方式打开文件
lines=openfile.readlines() #读取该文件的所有行
rule='<script language="JavaScript">' #定义rule变量,内容为病毒代码的开始部分
new_lines=[] #创建空列表
for line in lines: #遍历文件的所有航
if rule in line: #如果rule变量内的内容存在于lines,则跳出该轮循环执行下一轮循环
break
else: #如果不存在,则将读取的内容写入列表中
new_lines.append(line)
openfile.close() #关闭文件
writefile=open(path,'w')
writefile.writelines(new_lines) #将列表中的内容写入文件
writefile.close() #关闭文件
运行后的结果:
再次打开网页查看:
无弹窗显示,则恶意弹窗代码删除完毕。