千万级实时音视频转码架构设计方案

架构图

这里写图片描述

关于人声时长计算

  • 通过频域分量信号转成分贝数据,从而实现人声时间统计的。(建议设置为:20-60分贝左右的参数)
  • 1分贝是人类耳朵刚刚能听到的声音,20分贝以下的声音,一般来说,我们认为它是安静的。20-40分贝大约是细声。40-60分贝属于我们正常的交谈声音。60分贝以上就属于吵闹范围了,70分贝我们就可以认为它是很吵的,而且开始损害听力神经,90分贝以上就会使听力受损

http接口参数

  • 音频文件接口
    chnel:(mon, left, right)
{
"name":xxx.mp3
"chnel":mon
"url":xxx.oss.ali.com/xxx.mp3
}
  • 人声时长数据接口
    chnel:(right, left)
{
"name":xxx.mp3
"chnel":mon
"url":xxx.oss.ali.com/xxx.mp3
}

说明

  • 利用serverless技术能够对音频进行实时转换,调用次数按量计费。并发量不限制。

  • 每种转换使用不同的函数,可以进行并行计算

  • 每当上传音频文件到OSS中,会自动进行转码工作

新建函数计算服务

  • 选择已有的角色

添加触发器

  • 设置触发器类型:对象存储触发器
  • 在阿里云创建函数计算,绑定OSS的上传音频的bucket

基础管理配置

  • 命名函数名称(随意)
  • 运行环境为python2.7
  • 使用代码打包的方式上传(把代码上传到上面就行了)
  • 添加环境变量
  • 超时时间设置为600秒,否者转码可能会失败。

角色授权设置

  • 选择已有的角色

环境变量参数说明

  • AUDIO_CONVERT_ARG : 音频编码参数
  • OSS_PUT_ADDR:转码完成的文件放置的OSS地址
  • OSS_PUT_BUCKET: 转码完成的文件放置的BUCKET
  • OSS_WATCH_ADDR:监视新音频文件上传的地址
  • OSS_WATCH_BUCKET:监视的新音频文件的BUCKET
频谱分析参数
  • OSS_MIN_dB:(最小分贝)
  • OSS_MAX_dB:(最大分贝)
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值