html状态查询爱站,批量查询网页状态码以及标题

做SEO以及SEM的时候经常会要用到查询网页的标题以及状态码,这篇文章使用2种方法批量查询网页标题与状态码。并快速批量导出数据

使用爱站SEO工具

04c0c07244377c5d8964b95071a55ec3.gif

操作如上图,直接通过文件导入然后可以批量查询网页的状态码,但是不能够批量查询网页标题

domain2ip

2. 修改下载文件domain2ip.py 第169行 修改导入文件目录

04c0c07244377c5d8964b95071a55ec3.gif

3.python 运行脚本

04c0c07244377c5d8964b95071a55ec3.gif

4.如果python 程序不能运行 可通过下列命令行进行安装

04c0c07244377c5d8964b95071a55ec3.gif

pip install ipwhois

poython 批量查询ip脚本

脚本要求:python 2.7版本,如果缺乏部分插件可以直接pip进行安装

修改下文中:/mnt/d/web.txt 为链接地址

/mnt/d/jieguo.txt 为保存地址

#coding=utf-8

import urllib,time

import StringIO

import pycurl

def get_http_status(url):

html = StringIO.StringIO()

c = pycurl.Curl()

myurl=url

c.setopt(pycurl.URL, myurl)

c.setopt(pycurl.WRITEFUNCTION, html.write)

c.setopt(pycurl.FOLLOWLOCATION, 1)

c.setopt(pycurl.MAXREDIRS, 5)

c.setopt(pycurl.CONNECTTIMEOUT, 60)

c.setopt(pycurl.TIMEOUT, 300)

c.setopt(c.HEADER, True)

c.setopt(pycurl.USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)")

ret = c.perform()

ret = html.getvalue()

if "200" in ret:

print url,c.getinfo(c.HTTP_CODE)

return 1

elif "404" in ret:

print url,c.getinfo(c.HTTP_CODE)

f = open(' /mnt/d/web.txt ','a')

f.write(url+'\n')

f.close()

return 0

if __name__=="__main__":

urls=open(' /mnt/d/jieguo.txt','r').readlines()

oknum=0

lostnum=0

for url in urls:

if get_http_status(url.strip()):

oknum+=1

else:

lostnum+=1

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值