人脸识别 + 语音识别实现智能电话会议 | python demo

大数据AI笔记

已于 2022-02-21 09:50:31 修改

阅读量5.2k

点赞数 4

分类专栏： ASR | 深度语音文章标签：人工智能人脸识别语音识别 python demo

于 2018-02-07 10:20:45 首次发布

本文链接：https://blog.csdn.net/qq_30262201/article/details/79277212

版权

ASR | 深度语音专栏收录该内容

32 篇文章 101 订阅 ¥49.90 ¥99.00

订阅专栏

本文演示了一个基于python的智能电话会议系统，包括人脸识别进行身份确认和语音识别进行会议内容转写。预备知识涉及python编程和opencv人脸识别。服务端通过上传照片识别参会者身份，语音转写则将音频转化为文字。

摘要由CSDN通过智能技术生成

把最近的调研demo整理出来，实现智能电话会议，我提供两个核心的web服务，一个是人脸识别实现身份确认，一个是语音识别实现会议内容实时转写。

预备知识

python 写一个静态服务（实战）

python3.6 编程技巧总结

opencv实现猫脸识别

一、实现流程

智能电话会议实现流程

二、身份确认-人脸识别

技术框架

人脸识别技术实现

这是一个轻量级的人脸识别服务
上传一张照片，它会返回照片的身份信息

实现过程

本地存储了用户的身份信息：

name = ['obama', 'huge', 'taorui']

对应照片：
obama
obama

huge

taorui

我们通过照相机获得参会者的照片：
taorui
上传服务器：curl -F "file=@taorui2.jpg" http://127.0.0.1:5001
服务器返回参会者的身份信息：
这里写图片描述
上传参会者照片到服务器：

返回参会者身份信息：

使用方法

在终端访问服务
$ curl -F “file=@taorui.jpg” http://127.0.0.1:5001
结果会以Json的形式展现，例如:
Returns:
{
“face_ID”: 0,
“f：ace_name”: “taorui”
}
NOTE: 这个服务需要python3.6的环境
先安装flask! 安装命令如下:
$ pip3 install flask

三、语音转写-语音识别

技术框架

语音转写技术框架

将整段语音转换成文字
输入pcm音频
输出识别后的文字

实现过程

将音频文件上传到服务器进行读取：
音频内容为：北京科技馆

#识别本地文件
pp = client.asr(get_file_content('audio\\16k.pcm'), 'pcm', 16000, {
    'lan': 'zh',
})

返回结果：
这里写图片描述

使用方法

要求python3.6环境
安装如下第三方库

pip install baidu-aip

python setup.py install

大数据AI笔记

关注

4
点赞
踩
21

收藏

觉得还不错? 一键收藏
打赏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

人脸识别 + 语音识别实现智能电话会议 | python demo

预备知识

一、实现流程

二、身份确认-人脸识别

技术框架

实现过程

使用方法

三、 语音转写-语音识别

技术框架

实现过程

使用方法

三、语音转写-语音识别