html状态查询爱站,批量查询网页状态码以及标题

最新推荐文章于 2024-06-07 18:11:32 发布

董云舟

最新推荐文章于 2024-06-07 18:11:32 发布

阅读量931

点赞数

文章标签： html状态查询爱站

做SEO以及SEM的时候经常会要用到查询网页的标题以及状态码，这篇文章使用2种方法批量查询网页标题与状态码。并快速批量导出数据

使用爱站SEO工具

操作如上图，直接通过文件导入然后可以批量查询网页的状态码，但是不能够批量查询网页标题

domain2ip

2. 修改下载文件domain2ip.py 第169行修改导入文件目录

3.python 运行脚本

4.如果python 程序不能运行可通过下列命令行进行安装

pip install ipwhois

poython 批量查询ip脚本

脚本要求：python 2.7版本，如果缺乏部分插件可以直接pip进行安装

修改下文中：/mnt/d/web.txt 为链接地址

/mnt/d/jieguo.txt 为保存地址

#coding=utf-8

import urllib,time

import StringIO

import pycurl

def get_http_status(url):

html = StringIO.StringIO()

c = pycurl.Curl()

myurl=url

c.setopt(pycurl.URL, myurl)

c.setopt(pycurl.WRITEFUNCTION, html.write)

c.setopt(pycurl.FOLLOWLOCATION, 1)

c.setopt(pycurl.MAXREDIRS, 5)

c.setopt(pycurl.CONNECTTIMEOUT, 60)

c.setopt(pycurl.TIMEOUT, 300)

c.setopt(c.HEADER, True)

c.setopt(pycurl.USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)")

ret = c.perform()

ret = html.getvalue()

if "200" in ret:

print url,c.getinfo(c.HTTP_CODE)

return 1

elif "404" in ret:

print url,c.getinfo(c.HTTP_CODE)

f = open(' /mnt/d/web.txt ','a')

f.write(url+'\n')

f.close()

return 0

if __name__=="__main__":

urls=open(' /mnt/d/jieguo.txt','r').readlines()

oknum=0

lostnum=0

for url in urls:

if get_http_status(url.strip()):

oknum+=1

else:

lostnum+=1

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
html状态查询爱站,批量查询网页状态码以及标题

做SEO以及SEM的时候经常会要用到查询网页的标题以及状态码，这篇文章使用2种方法批量查询网页标题与状态码。并快速批量导出数据使用爱站SEO工具操作如上图，直接通过文件导入然后可以批量查询网页的状态码，但是不能够批量查询网页标题domain2ip2. 修改下载文件domain2ip.py 第169行修改导入文件目录3.python 运行脚本4.如果python 程序不能运行可通过下列命令行进...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。