如何用python 爬虫 | 检查网站情况好坏

203 篇文章 15 订阅

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理

以下文章来源于腾讯云 作者:努力在北京混出人样

( 想要学习Python?Python学习交流群:1039649593,满足你的需求,资料都已经上传群文件流,可以自行下载!还有海量最新2020python学习资料。 )
在这里插入图片描述

1、网站大小估计

在谷歌或百度中输入site:域名
例如
在这里插入图片描述

显示这个网站有1亿0720万个网页。

2、识别网站所用的技术

在爬去网站之前,了解网站使用的技术,会对爬去数据有一定的印象。这里使用builtwith模块来探测网上搭建的技术。

import builtwith
builtwith.parse("http://www.jianshu.com")

结果:

 {u’javascript-frameworks’: [u’Prototype’, u’RequireJS’], 
  u’programming-languages’: [u’Ruby’], 
  u’web-frameworks’: [u’Twitter Bootstrap’, u’Ruby on Rails’]}

3、查看网站的拥有者

采用python-whois包,需要下载。

pip install python-whois

查看所有者

import whois
print(whois.whois("http://www.jianshu.com"))

结果:

 { 
   “updated_date”: [2016-04-06 00:00:00,2016-04-06 10:24:47],  
   “status”: [ 
     “clientTransferProhibited https://icann.org/epp#clientTransferProhibited“,  
     “clientTransferProhibited https://www.icann.org/epp#clientTransferProhibited” 
   ],  
   “name”: “Shanghai Bai Ji Information Technology Inc. Ltd,,  
   “dnssec”: “unSigned”,  
   “city”: “Shanghai”,  
   “expiration_date”: [2020-03-20 00:00:00,2020-03-20 18:28:58],  
   “zipcode”:200433,  
   “domain_name”: “JIANSHU.COM”,  
   “country”: “CN”,  
   “whois_server”: “whois.name.com”,  
   “state”: “Shanghai”,  
   “registrar”: “Name.com, Inc.,  
   “referral_url”: “http://www.name.com“,  
   “address”: “Innospace 2, B1, Building #5, KIC, No.316 Songhu Road , Yangpu District”,  
   “name_servers”: [ 
     “F1G1NS1.DNSPOD.NET”,  
     “F1G1NS2.DNSPOD.NET”,  
     “f1g1ns1.dnspod.net”,  
     “f1g1ns2.dnspod.net” 
   ],  
   “org”: “Shanghai Bai Ji Information Technology Inc. Ltd,,  
   “creation_date”: [2008-03-20 00:00:00,2008-03-20 18:28:58],  
   “emails”: [ 
     “contact@jianshu.com”,  
     “abuse@name.com” 
   ] 
 } 
 In [ ]:
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值