基于快速傅里叶变换实现的狗声识别器(人工智能)

开发背景

市场上很多宠物狗狗翻译器,猫语翻译器,动物交流器,它们没有采用正确的技术去实现,从而让动物声音翻译器变成人们笑料的工具。本人为了改变现状,刚好被裁员在家里休息,所以努力开发一款真正意义上能识别出动物声音的翻译器。总计耗时1个月(算法折腾半个月,js折腾半个月),躺了几次中医推拿才初步开发完成。整体只完成梦想的一小步,后续只能交给追梦者继续完善。
项目地址:https://github.com/windawake/dogsound

功能介绍

可以识别出包括狗狗在内的所有动物发出的声音,前提是先录音存到声音档案里面。

预览网址

使用手机火狐浏览器访问 https://app.jiajuren.net/ 同意开启录音和麦克风权限。

运行项目

运行环境:nginx+ssl+php+mysql

创建bowwow数据库 CREATE DATABASE bowwow; 然后执行根目录bowwow.sql文件,接着把app copy.json修改为app.json并且配置mysql连接参数

在根目录运行 php -S 0.0.0.0:13000 -t .
nginx反向代理到13000端口
参考配置

server {
	listen 3000 ssl http2;
	ssl_certificate /web/linux/vscode/ssl/server.crt;
    ssl_certificate_key /web/linux/vscode/ssl/server.key;
	add_header Access-Control-Allow-Origin *;
	server_name 0.0.0.0;
	index index.php index.html index.htm index.nginx-debian.html;
	location / {
		proxy_pass http://127.0.0.1:13000;
	}
}

最后访问https://127.0.0.1:3000 即可看到本地效果

实现原理

运用了移位运算,门阀检测声音,短时能量,短时过零率,短时快速傅里叶变换等技术,请参考这本书《语音信号处理实用教程》

注意事项

必须要https才能开启录音和麦克风权限

需要安静室内环境,录音要自然,识别时的发音要跟录音时的节奏一致。这样子才能达到80%识别率。室外在噪音干扰下,识别率几乎为0。

原文出处

https://learnku.com/articles/71608

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值