python微信域名或者链接批量检测

本文介绍如何使用Python从Google搜索结果中提取链接,并进行批量检测,将正常域名保存到'ok.txt',被屏蔽的则记录在'red.txt'。
摘要由CSDN通过智能技术生成

好久没上来写博客了,直入主题。

大家经常用google搜索,如何提取搜索结果的链接呢

google搜索结果url提取,F12,来到console端; 粘贴下面语句,回车。

 

var tag=document.getElementsByClassName('r');

 for (var i=0;i<tag.length;i++){
        var a=tag[i].getElementsByTagName("a");
        console.log(a[0].href)
 }

提取出来,保存到url.txt. 待检测的url和域名,一行一个,先经过去重去空白行

import io
import shutil
readPath='oldurl.txt'
writePath='url.txt'
lines_seen=set()
outfiile=io.open(writePath,'a+',encoding='utf-8')
f=io.open(readPath,'r',encoding='utf-8')
for line in f:
    if not len(line):
        continue
    if line not in lines_seen:
        outfiile.write(line)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值