因实验需要,要将一段语音上传至服务器,在服务端(Linux平台)通过语音识别算法计算该语音所对应的说话人向量和语音转写结果,然后返回给客户端(Windows平台或者Linux平台)。
为了便于跨平台实现,打算搭建一个基于http的服务端实现该功能。考虑到只是实验使用,采用基于python的轻量化web框架flask实现。服务端的搭建和客户端的连接过程如下:
一、服务端
服务端提供语音文件上传和语音识别结果下载功能,分别响应http的post和get请求。
from werkzeug.utils import secure_filename
@app.route('/upload', methods=['GET', 'POST'])
def upload_file():
if request.method == 'POST':
file = request.files['the_file']
file.save(f"/home/test/uploads/{secure_filename(file.filename)}")
(待补充)
二、客户端
客户端基于python脚本,利用requests分别实现post和get请求,从而进行文件上传和下载。
import requests
(待补充)