Python 检测网页中缺少的图片的地址和名称,和其他必要的因素

import requests
import re
import win32api,win32con
import pyperclip
a='''/anquan
/erjian
/huanping
/jianli
/jingji
/xiaofang
/zaojia
/zckjs
/erjian
/zjkjs
/cjkjs
/yijian'''
b=a.split('\n')

imgUrl='https://360st.skwjy.com/jl.html#3602'
def check(url,mustin):

    res=requests.get(url)
    for i in mustin:
        if i not in res.text:
            print(url+'出现错误缺少'+i)
            # pyperclip.copy(i)

    jpgcomp=re.compile('src=".*?jpg')
    jpglist=jpgcomp.findall(res.text)
    pngcomp=re.compile('src=".*?png')
    pnglist=pngcomp.findall(res.text)
    jpegcomp=re.compile('src=".*?jpeg')
    jpeglist=jpegcomp.findall(res.text)
    gifcomp=re.compile('src=".*?gif')
    giflist=gifcomp.findall(res.text)
    zonghe=jpglist+pnglist+jpeglist+giflist
    for xx in zonghe:
        xx='http:'+xx.replace('src="','').replace("src='","")
        picres=requests.get(xx)
        

        if picres.status_code==404:
            print(url,xx)
            # win32api.MessageBox(0, xx, "提醒",win32con.MB_OK)
            #pyperclip.copy(xx)


mustin=['<script type="text/javascript" src="//photos.sdgcbbs.com/js/tongyong.js"></script>','<script>document.write(webname);</script>','//photos.sdgcbbs.com/images/ico1-1.jpg']
# url=pyperclip.paste()
url='https://bd2.sdjiantu.com'
for xx in b:
    urlm=url+xx
    check(urlm,mustin)
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lisheng386

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值