自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

YZhang0108的博客

原创基于TensorFlow目标检测算法SSD来定位圆形指针式仪表表盘

圆形指针式仪表自动识别 —— 圆形表盘定位目的：检测出圆形表盘边框的所在矩形区域，排除无关背景干扰，提升后续算法计算速度和识别精度。SSD目标检测算法：采用基于深度学习的目标检测算法SSD(single shot multibox detector),相比Faster RCNN 有明显的速度优势，相比YOLO又有明显的mAP优势（不过已经被CVPR 2017的YOLO9000超越）。参考TensorFlow官方开源的目标检测代码：https://github.com/tensorflow/mode

2020-05-28 19:12:22 3703 4

原创基于深度学习方法的声纹识别（Speaker Recognition）论文综述

声纹识别（Speaker Recognition），是一项提取说话人声音特征和说话内容信息，自动核验说话人身份的技术。声纹识别通常分为两类：Speaker Verification （说话人验证）和Speaker identification （说话人识别）。Speaker Verification （说话人验证）：使用自己的语音进行验证。如果说话人宣称是某个身份，使用语音对此进行验证。S...

2020-04-30 16:15:13 6791 10

原创基于端到端深度学习方法的语音唤醒(Keyword Spotting)模型和论文

语音唤醒，即关键词检索（keyword spotting, KWS）。用语音唤醒设备，让设备由休眠状态切换至工作状态。下面主要对基于端到端的深度学习方法的语音唤醒模型总结。模型输入为语音，输出为各唤醒词的概率，一个模型解决，不需要再进行解码。通常包括三个部分：第一步是特征的提取，第二步是一个神经网络，它的输入是语音特征，输出是各个关键词和非关键词即Filler这样一个后验概率。由于第二步的网...

2020-04-26 16:20:41 9506

原创 OpenCV批量将文件夹下的视频隔一定帧数取一张图像并保存

OpenCV对视频处理，以下为Python代码：默认每隔10帧取一张图像，每张图像命名为 {视频名}_{数字编号}.jpgimport numpy as npimport cv2import globimport timeimport osdef process_video(VIDEO_PATH,count): head, tail = os.path.split(VID...

2020-04-21 11:56:51 941

原创 Opencv3.1+VS2013编译CMT跟踪算法

第一步：下载CMT源码。官方下载地址为：http://www.gnebehay.com/cmt/ ；然后解压。我的路径为：D:\CppMT-master。第二步：下载最新的Cmake工具。官方下载地址：https://cmake.org/download/ 。我下载版本为：Cmake3.9.0。如下图。下载完成后解压，我的路径为：D:\cmake-3.9.0-rc5-win64-x64。...

2020-04-20 18:30:44 355 1

原创 OpenCV3.1+VS2013 一劳永逸开发环境配置

注：本人电脑系统为：Windows7 64位第一步：下载和安装OpenCV SDK在官网http://opencv.org/上找到OpenCV Windows版本下载下来。本文选择版本为OpenCV3.1.0。下载完成后双击解压到指定文件夹。本人直接解压到D盘，例：D:\opencv3.1。第二步:OpenCV环境变量配置配置方法如下：【计算机】——【（右键）属性】——【高级系统设置】—...

2020-04-20 18:21:28 269

原创 Linux（Ubuntu）下文件批量重命名/删除/移动/解压

Linux批量操作常用命令，需要在终端执行1、批量重命名以将目录下所有包含W0的文件重命名为-W0为例：rename -v 's/W0/-W0/' *.wav2、批量删除以批量删除目录（dev）下的指定文件（包含W02的文件）为例：find dev -name "*W02*.wav" -exec rm -rf "{}" \; 3、批量移动以批量移动目录(dev)下所有指定文件到...

2020-04-20 17:28:51 1364

原创 Linux(Ubuntu)中对音频批量转换格式MP3转WAV/PCM转WAV

1、批量将MP3格式音频转换成WAV格式利用ffmpeg工具，统一处理成16bit ，小端编码，单通道，16KHZ采样率的wav音频格式。首先新建Mp3ToWav.sh 文件以路径/home/XXX下音频处理为例，编辑如下代码段：#!/bin/bashfolder=/home/XXXfor file in $(find "$folder" -type f -iname "*.mp3...

2020-04-20 17:11:46 2490 1

原创安卓开发之如何在JNI中使用OpenCV

安卓开发：在JNI中使用OpenCV环境：Android StudioStep1：在OpenCV官网下载Android SDK,如选择opencv-3.4.3-android-sdk.zip,解压得到OpenCV-android-sdk。Step2: 新建AS工程,在Create Android Project勾选Include C++ support，这样就新建了支持JNI的工程。S...

2020-04-17 19:23:11 700 1

原创 Ubuntu16.04下Android配置JDK/SDK/NDK

配置环境gedit ~/.bashrc编辑#配置JDKexport JAVA_HOME=/home/sky/Android/jdk1.7.0_79(安装目录路径)export JRE_HOME=/home/sky/android/jdk1.7.0_79/jre(安装目录路径)export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/...

2020-04-17 18:57:21 362 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除