一、使用Flask部署Pytorch模型
其实原理很简单,我们希望使用一个已经训练好的pytorch模型,用它做预测或生成。我们的模型部署在服务器上,客户端可以通过http request调用我们部署在服务器上的模型,并用http response返回结果,这就和web应用的原理是一样的,所以可以使用Flask搭建一个轻量的web应用,只不过这个应用没有“网页”而已。
Flask是一个用Python编写的Web应用程序框架,如果用过Django的话可以理解为Flask是一个比Django还要更轻量的web框架。
https://zhuanlan.zhihu.com/p/35879835提供了一个很详细的例子。
二、Gunicorn拉起应用
【参考https://www.jianshu.com/p/fecf15ad0c9a https://juejin.im/post/6844903983388213256】
Flask非常容易上手,它自带的app.run()
用来调试非常方便,但是用于生产环境无论是处理高并发还是鲁棒性都有所欠缺,一般会配合WGSI容器来进行[生产环境的部署
2.1 安装
首先pip安装gunicorn(注意 gunicorn 不能在 windows 环境下使用)
pip install gunicorn