自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 基于TensorFlow目标检测算法SSD来定位圆形指针式仪表表盘

圆形指针式仪表自动识别 —— 圆形表盘定位目的:检测出圆形表盘边框的所在矩形区域,排除无关背景干扰,提升后续算法计算速度和识别精度。SSD目标检测算法:采用基于深度学习的目标检测算法SSD(single shot multibox detector),相比Faster RCNN 有明显的速度优势,相比YOLO又有明显的mAP优势(不过已经被CVPR 2017的YOLO9000超越)。参考TensorFlow官方开源的目标检测代码:https://github.com/tensorflow/mode

2020-05-28 19:12:22 3527 4

原创 基于深度学习方法的声纹识别(Speaker Recognition)论文综述

声纹识别(Speaker Recognition),是一项提取说话人声音特征和说话内容信息,自动核验说话人身份的技术。声纹识别通常分为两类:Speaker Verification (说话人验证)和Speaker identification (说话人识别)。Speaker Verification (说话人验证):使用自己的语音进行验证。如果说话人宣称是某个身份,使用语音对此进行验证。S...

2020-04-30 16:15:13 6304 10

原创 基于端到端深度学习方法的语音唤醒(Keyword Spotting)模型和论文

语音唤醒,即关键词检索(keyword spotting, KWS)。用语音唤醒设备,让设备由休眠状态切换至工作状态。下面主要对基于端到端的深度学习方法的语音唤醒模型总结。模型输入为语音,输出为各唤醒词的概率,一个模型解决,不需要再进行解码。通常包括三个部分:第一步是特征的提取,第二步是一个神经网络,它的输入是语音特征,输出是各个关键词和非关键词即Filler这样一个后验概率。由于第二步的网...

2020-04-26 16:20:41 8846

原创 OpenCV批量将文件夹下的视频隔一定帧数取一张图像并保存

OpenCV对视频处理,以下为Python代码:默认每隔10帧取一张图像,每张图像命名为 {视频名}_{数字编号}.jpgimport numpy as npimport cv2import globimport timeimport osdef process_video(VIDEO_PATH,count): head, tail = os.path.split(VID...

2020-04-21 11:56:51 861

原创 Opencv3.1+VS2013编译CMT跟踪算法

第一步:下载CMT源码。官方下载地址为:http://www.gnebehay.com/cmt/ ;然后解压。我的路径为:D:\CppMT-master。第二步:下载最新的Cmake工具。官方下载地址:https://cmake.org/download/ 。我下载版本为:Cmake3.9.0。如下图。下载完成后解压,我的路径为:D:\cmake-3.9.0-rc5-win64-x64。...

2020-04-20 18:30:44 296 1

原创 OpenCV3.1+VS2013 一劳永逸开发环境配置

注:本人电脑系统为:Windows7 64位第一步:下载和安装OpenCV SDK在官网http://opencv.org/上找到OpenCV Windows版本下载下来。本文选择版本为OpenCV3.1.0。下载完成后双击解压到指定文件夹。本人直接解压到D盘,例:D:\opencv3.1。第二步:OpenCV环境变量配置配置方法如下:【计算机】——【(右键)属性】——【高级系统设置】—...

2020-04-20 18:21:28 209

原创 Linux(Ubuntu)下文件批量重命名/删除/移动/解压

Linux批量操作常用命令,需要在终端执行1、批量重命名以将目录下所有包含W0的文件重命名为-W0为例:rename -v 's/W0/-W0/' *.wav2、批量删除以批量删除目录(dev)下的指定文件(包含W02的文件)为例:find dev -name "*W02*.wav" -exec rm -rf "{}" \; 3、批量移动以批量移动目录(dev)下所有指定文件到...

2020-04-20 17:28:51 1151

原创 Linux(Ubuntu)中对音频批量转换格式MP3转WAV/PCM转WAV

1、批量将MP3格式音频转换成WAV格式利用ffmpeg工具,统一处理成16bit ,小端编码,单通道,16KHZ采样率的wav音频格式。首先新建Mp3ToWav.sh 文件以路径/home/XXX下音频处理为例,编辑如下代码段:#!/bin/bashfolder=/home/XXXfor file in $(find "$folder" -type f -iname "*.mp3...

2020-04-20 17:11:46 2305 1

原创 安卓开发之如何在JNI中使用OpenCV

安卓开发:在JNI中使用OpenCV环境:Android StudioStep1:在OpenCV官网下载Android SDK,如选择opencv-3.4.3-android-sdk.zip,解压得到OpenCV-android-sdk。Step2: 新建AS工程,在Create Android Project勾选Include C++ support,这样就新建了支持JNI的工程。S...

2020-04-17 19:23:11 610 1

原创 Ubuntu16.04下Android配置JDK/SDK/NDK

配置环境gedit ~/.bashrc编辑#配置JDKexport JAVA_HOME=/home/sky/Android/jdk1.7.0_79(安装目录路径)export JRE_HOME=/home/sky/android/jdk1.7.0_79/jre(安装目录路径)export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/...

2020-04-17 18:57:21 313 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除