很多时候,我们写了爬虫程序,却不知道目标服务器后台具体是什么样子的,有时我们也不清楚我们的爬虫是否成功挂载了代理IP,所以可以用简单的tornado服务器来进行一下自我攻防演练。
- 本tornado服务器小程序在爬虫测试中的作用
- 能够模拟真实的我们要爬取的服务器后台
- 检测并查看爬虫的host主机地址
- 检测并查看爬虫的header头部
- 检测我们的爬虫代理IP是否已经挂载成功
# 建立一个tornado服务器,用来测试爬虫
import tornado.web
import tornado.ioloop
import tornado.httpserver
class IndexHandler(tornado.web.RequestHandler):
def get(self):
#def post(self):
self.write('helllo tornado')
print('---------request-----------------')
print(self.request)
print('---------request-headers---')
print(self.request.headers)
if __name__=='__main__':
#建立应用
app=tornado.web.Application([
(r'/api',IndexHandler),
],
debug=True,
)
#建立服务器实例
httpserver=tornado.httpserver.HTTPServer(app)
#绑定IP
httpserver.bind(8000)
#开启监听
httpserver.start(1)
#IOLOOP循环
tornado.ioloop.IOLoop.current().start()