python nginx+uwsgi+WSGI 处理请求详解

最新推荐文章于 2024-07-19 11:24:36 发布

weixin_30642267

最新推荐文章于 2024-07-19 11:24:36 发布

阅读量644

点赞数

文章标签： python 运维网络

原文链接：http://www.cnblogs.com/cooffeeli/p/6848227.html

版权

请求从 Nginx 到 uwsgi 到 django 交互概览

作为python web开发，我们首先要弄清楚，到底一个请求过来，发生了什么事，请求的传递是怎么样完成的，由nginx是怎么转发到uwsgi, uwsgi又是怎样把请求传给到我们的框架（django or falsk）由我们自己写的代码处理，返回数据给客户端的。因此我作了以下一个粗略的流程图：

uwsgi 处理过程.png

以下我会逐个步骤从下往上详细讲解，并附上代码和配置，

WSGI 协议

从上面的图看得出 wsgi server (比如uwsgi）要和 wsgi application（比如django ）交互，uwsgi需要将过来的请求转给django 处理，那么uwsgi 和 django的交互和调用就需要一个统一的规范，这个规范就是WSGI WSGI（Web Server Gateway Interface），WSGI是 Python PEP333中提出的一个 Web 开发统一规范。

Web 应用的开发通常都会涉及到 Web 框架（django, flask）的使用，各个 Web 框架内部由于实现不同相互不兼容，给用户的学习，使用和部署造成了很多麻烦。
正是有了WSGI这个规范，它约定了wsgi server 怎么调用web应用程序的代码，web 应用程序需要符合什么样的规范，只要 web 应用程序和 wsgi server 都遵守 WSGI 协议，那么，web 应用程序和 wsgi server就可以随意的组合。比如uwsgi+django , uwsgi+flask, gunicor+django, gunicor+flask 这些的组合都可以任意组合，因为他们遵循了WSGI规范。

WSGI 标准

WSGI 标准中主要定义了两种角色：

“server” 或 “gateway” 端
“application” 或 “framework” 端

为了方便理解，我们可以把server具体成 uwsgi， application具体成django

这里可以看到，WSGI 服务器需要调用应用程序的一个可调用对象，这个可调用对象（callable object）可以是一个函数，方法，类或者可调用的实例，总之是可调用的。

下面是一个 callable object 的示例，这里的可调用对象是一个函数：

def simple_app(environ, start_response):
    """Simplest possible application object"""
    status = '200 OK'
    response_headers = [('Content-type', 'text/html')]
    start_response(status, response_headers)
    return ['Hello World']

这里，我们首先要注意，这个对象接收两个参数：

environ：请求的环境变量，它是一个字典，包含了客户端请求的信息，如 HTTP 请求的首部，方法等信息，可以认为是请求上下文，
start_response：一个用于发送HTTP响应状态（HTTP status ）、响应头（HTTP headers）的回调函数。在返回内容之前必须先调用这个回掉函数

上面的 start_response 这个回调函数的作用是用于让 WSGI Server 返回响应的 HTTP 首部和 HTTP 状态码。这个函数有两个必须的参数，返回的状态码和返回的响应首部组成的元祖列表。返回状态码和首部的这个操作始终都应该在响应 HTTP body 之前执行。

还需要注意的是，最后的返回结果，应该是一个可迭代对象，这里是将返回的字符串放到列表里。如果直接返回字符串可能导致 WSGI 服务器对字符串进行迭代而影响响应速度。

当然，这个函数是一个最简单的可调用对象，它也可以是一个类或者可调用的类实例。

WSGI 实例

wsgi application 的代码 app.py

def application(env, start_response):
    start_response('200 OK', [('Content-Type', 'text/html'), ('X-Coder', 'Cooffeeli')])
    return ['<h1>你好！！世界</h1>']

wsgi server 代码 wsgi_server.py
我们可以借助 python 的 wsgiref 库运行一个 WSGI 服务器（当然这个 WSGI 服务器同时也是 Web 服务器），用它来运行我们的 application

from wsgiref.simple_server import make_server
from app import application

# 启动 WSGI  服务器
httpd = make_server (
    'localhost',
    9000,
    application # 这里指定我们的 application object)
)
# 开始处理请求
httpd.handle_request()

python wsgiref_server.py

运行上面的程序，并访问 http://localhost:9000 ，将返回此次请求所有的首部信息。
这里，我们利用 environ 字典，获取了请求中所有的变量信息，构造成相应的内容返回给客户端。
environ 这个参数中包含了请求的首部，URL，请求的地址，请求的方法等信息。可以参考 PEP3333来查看 environ 字典中必须包含哪些 CGI 变量。

自己实现WSGI Server

既然我们知道了WSGI的规范，我们完全可以自己实现一个WSGI Server
根据这个规范，我们可以总结WSGI Server需要实现以下功能：

监听端口，接收请求
接受HTTP请求后，解析HTTP协议
根据HTTP内容，生成env参数，该参数包括HTTP，wsgi信息，可以看作是请求上下文
实现一个start_response函数，作为调用application的参数，用作application回调函数，负责http相应头

实现代码： WSGIServer.py

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import socket
import sys
import StringIO
from app import application
from datetime import datetime

class WSGIServer(object):

    def __init__(self, server_address):
        """初始构造函数, 创建监听socket"""
        self.listen_sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
        self.listen_sock.bind(server_address)
        self.listen_sock.listen(5)
        (host, port) = self.listen_sock.getsockname()
        self.server_port = port
        self.server_name = socket.getfqdn(host)


    def set_application(self, application):
        """设置wsgi application, 供server 调用"""
        self.application = application


    def get_environ(self):
        """构造WSGI环境变量，传给application的env参数"""
        self.env = {
            'wsgi.version': (1, 0),
            'wsgi.url_scheme': 'http',
            'wsgi.errors': sys.stderr,
            'wsgi.multithread': False,
            'wsgi.run_once': False,
            'REQUEST_METHOD': self.request_method,
            'PATH_INFO': self.request_path,
            'SERVER_NAME': self.server_name,
            'SERVER_PORT': str(self.server_port),
            'wsgi.input': StringIO.StringIO(self.request_data),
        }
        return self.env


    def start_response(self, http_status, http_headers):
        """构造WSGI响应， 传给application的start_response"""
        self.http_status = http_status
        self.http_headers = dict(http_headers)
        headers = {
            'Date': datetime.utcnow().strftime('%a, %d %b %Y %H:%M:%S GMT'),
            'Server': 'WSGIServer 1.0'
        }
        self.http_headers.update(headers)


    def parse_request(self, text):
        """获取http头信息，用于构造env参数"""
        request_line = text.splitlines()[0]
        request_info = request_line.split(' ')
        (self.request_method,
        self.request_path,
        self.request_version) = request_info


    def get_http_response(self, response_data):
        """完成response 内容"""
        res = 'HTTP/1.1 {status} \r\n'.format(status=self.http_status)
        for header in self.http_headers.items():
            res += '{0}: {1} \r\n'.format(*header)

        res += '\r\n'

        res_body = ''
        for val in response_data:
            res_body += val

        res += res_body

        return res


    def handle_request(self):
        """处理请求"""
        # 初始版本，只接受一个请求
        conn, addr = self.listen_sock.accept()

        # 获取http 请求的request内容
        self.request_data = conn.recv(1024)
        self.parse_request(self.request_data)

        # 构造调用application需要的两个参数 env, start_response
        env = self.get_environ()
        start_response = self.start_response

        # 调用application, 并获取需要返回的http response内容
        response_data = self.application(env, start_response)

        # 获取完整http response header 和 body, 通过socket的sendall返回到客户端
        res = self.get_http_response(response_data)
        conn.sendall(res)

        # 脚本运行完毕也会结束
        conn.close()


def make_server(server_address, application):
    """创建WSGI Server 负责监听端口，接受请求"""
    wsgi_server = WSGIServer(server_address)
    wsgi_server.set_application(application)

    return wsgi_server


SERVER_ADDRESS = (HOST, PORT) =  '', 8124
wsgi_server = make_server(SERVER_ADDRESS, application)
wsgi_server.handle_request()

上面的 WSGI 服务器运行过程为：

初始化，创建套接字，绑定端口
接收客户端请求
解析 HTTP 协议
构造 WSGI 环境变量（environ）
调用 application
回调函数 start_response 设置好响应的状态码和首部
返回信息

至此， wsgi server -> wsgi application 的交互讲解完毕，下面我们继续看nginx->uwsgi交互过程

启动 uwsgi

上面说了我们自己实现WSGI Server的过程，现在我们用uwsgi 来作为Server
运行监听请求uwsgi

uwsgi --http :9090 --wsgi-file foobar.py --master --processes 4 --threads 2

执行这个命令会产生4个uwsgi进程（每个进程2个线程），1个master进程，当有子进程死掉时再产生子进程，1个 the HTTP router进程，一个6个进程。

这个Http route进程的地位有点类似nginx，(可以认为与nginx同一层)负责路由http请求给worker, Http route进程和worker之间使用的是uwsgi协议

FastCgi协议， uwsgi协议， http协议有什么用？

在构建 Web 应用时，通常会有 Web Server (nginx)和 Application Server(wsgi server eg:uwsgi) 两种角色。其中 Web Server 主要负责接受来自用户的请求，解析 HTTP 协议，并将请求转发给 Application Server，Application Server 主要负责处理用户的请求，并将处理的结果返回给 Web Server，最终 Web Server 将结果返回给用户。

由于有很多动态语言和很多种 Web Server，他们彼此之间互不兼容，给程序员造成了很大的麻烦。因此就有了 CGI/FastCGI ，uwsgi 协议，定义了 Web Server 如何通过输入输出与 Application Server 进行交互，将 Web 应用程序的接口统一了起来。

总而言之，这些协议就是进程交互的一种沟通方式。
举个例子：美国人和中国人沟通必须要有一个公共的语言：英语，这时候英语就是两个人沟通的协议，不然，一个说英语（uwsgi协议），一个说中文（fastcgi协议）是肯定会乱码的，处理不成功的。用同一个协议，大家都知道该如何解析过来的内容。
所以，nginx 和 uwsgi交互就必须使用同一个协议，而上面说了uwsgi支持fastcgi,uwsgi,http协议，这些都是nginx支持的协议，只要大家沟通好使用哪个协议，就可以正常运行了。

将uwsgi 放在nginx 后面

将uwsgi 放在nginx后面，让nginx反向代理请求到uwsgi

uwsgi 原生支持HTTP， FastCGI， SCGI，以及特定的uwsgi协议，性能最好的明显时uwsgi, 这个协议已经被nginx支持。

所以uwsgi 配置使用哪个协议，nginx 要使用对应协议

# 使用http协议
 uwsgi --http-socket 127.0.0.1:9000 --wsgi-file app.py

# nginx配置
lcation / {
  proxy_pass 127.0.0.1:9000;
}

更多协议

[uwsgi]
# 使用uwsgi协议 socket, uwsgi-socket 都是uwsgi协议
# bind to the specified UNIX/TCP socket using default protocol
# UNIX/TCP 意思时可以UNIX: xx.sock, 或者 TCP: 127.0.0.1:9000 他们是都可以的
# UNIX 没有走TCP协议，不是面向连接, 而是直接走文件IO
# nginx 使用uwsgi_pass
 socket = 127.0.0.1:9000
 socket = /dev/shm/owan_web_uwsgi.sock
 uwsgi-socket = /dev/shm/owan_web_uwsgi.sock
# nginx 使用 uwsgi_pass   /dev/shm/owan_web_uwsgi.sock;

# 使用fastcgi协议 fastcgi-socket 
# bind to the specified UNIX/TCP socket using FastCGI protocol
# nginx 就可以好象PHP那样配置 使用fastcgi_pass
 fastcgi-socket = /dev/shm/owan_web_uwsgi.sock
# nginx 使用fastcgi_pass   /dev/shm/owan_web_uwsgi.sock;

# 使用http协议 http-socket
# bind to the specified UNIX/TCP socket using HTTP protocol
# nginx 使用proxy_pass
# 原来proxy_pass 是http协议，但不一定要用TCP
# proxy_pass http://unix:/dev/shm/owan_web_uwsgi.sock; 
http-socket = /dev/shm/owan_web_uwsgi.sock
# nginx 使用 proxy_pass   /dev/shm/owan_web_uwsgi.sock;

chdir = /data/web/advance_python/uwsgi/
wsgi-file = app.py
processes = 4
threads = 2
master = true
...