python删除网页中的恶意代码(一)

        网页中可能会因为各种原因被插入恶意代码,比如弹窗之类的代码,会导致正常的网页在使用中无限次被弹窗广告骚扰,我们可以根据弹窗的标签来定位,然后删除弹窗代码: 

例如,被插入恶意代码的html网页:

其中,被插入的恶意代码是:

<script language="JavaScript">{
     var xmldoc = new ActiveXObject("MSXML2.DOMDocument.3.0");
     xmldoc.load("<root><child></child></root>");
     alert(xmldoc.xml);
}
</script>
<script language="JavaScript">
    alert("hello world");
</script>

这一部分代码的作用是在网页中以弹窗的形式显示:

则,为了方便检查,也为了可以便捷的删除恶意代码,则可以使用如下的python代码:

import os
#获取templaters目录的路径
curr_path=os.getcwd()    #获取当前目录
templaters_path=os.path.join(curr_path,'templaters')     #使用join函数拼接得到templaters目录路径
#使用os.listdir()函数获取指定目录中的文件和文件夹
all_files=os.listdir(templaters_path)
#遍历所有文件
for file in all_files:
    path=os.path.join(templaters_path,file)       #使用join函数拼接得到file的完整路径
    openfile=open(path,'r')     #以只读方式打开文件
    lines=openfile.readlines()   #读取该文件的所有行
    rule='<script language="JavaScript">'      #定义rule变量,内容为病毒代码的开始部分
    new_lines=[]         #创建空列表
    for line in lines:     #遍历文件的所有航
        if rule in line:    #如果rule变量内的内容存在于lines,则跳出该轮循环执行下一轮循环
            break
        else:             #如果不存在,则将读取的内容写入列表中
            new_lines.append(line)
    openfile.close()              #关闭文件
    writefile=open(path,'w')
    writefile.writelines(new_lines)             #将列表中的内容写入文件
    writefile.close()          #关闭文件

运行后的结果:

再次打开网页查看:
 

无弹窗显示,则恶意弹窗代码删除完毕。 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

胖锤喵喵

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值