自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (3)
  • 收藏
  • 关注

原创 向shell脚本传参数

执行“nano test.sh”创建一个新的shell脚本。脚本test.sh的内容如下:#!/bin/shname=$1echo "the ${name} are great man!"给新创建的test.sh的脚本赋可执行权限,命令为“chmod 75

2017-10-31 18:58:26 400

原创 使用pyspider爬虫爬取百度图片

第一步:安装pyspider:pip install pyspider。第二部:防火墙:firewall-cmd --zone=public --add-port=5000/tcp --permanent测试:firewall-cmd --reload第三部:运行命令使之跑起来:前段运行:pyspider all。后端运行:nohup pyspider ...

2017-10-31 18:41:22 998

原创 kaldi训练thchs30详细步骤

一、下载源码,https://github.com/kaldi-asr。二、进入thchs30/s5文件夹,修改run.sh里面的数据路径,我才用了直接下载的方式,因为之前没有这方面的数据。三、修改cmd.sh: export train_cmd=run.plexport decode_cmd=run.plexport mkgraph_cmd=run.ple

2017-10-26 16:42:22 8191 3

原创 ffmpeg的详细使用方法

今天在做语音识别的工作时,遇到一个问题,用自己的音频进行识别,提示错误:sample rate is more than 16KHz。解决办法:ffmpeg -y -i "0.wav" -ar 16000 -ac 1 "1.wav"上面的命令顺便将声道也转换成了单声道。在我们使用ffmpeg的过程中,可能简单的几个命令字符即可解决问题,但是若用的不一样或者少

2017-10-26 16:17:19 8648

原创 python聚类

用Python实现文档聚类图像聚类:参考一参考二参考三

2017-10-24 17:26:12 595

转载 语音识别标准中WER和SER解释

在语音识别中,常用的评估标准为词错误率WER,WER计算方式为:为了使识别出来的词序列和标准的词序列之间保持一致,需要进行替换,删除,或者插入某些词,这些插入,替换,删除的词的总个数,除以标准的词序列中词的个数的百分比,即为WER,其计算公式如下所示:需要注意的是,因为有插入词,所以WER有可能大于100%,例子:如下图所示:第一行为标准的词序列

2017-10-23 11:29:11 12336

原创 kaldi问题:local/score.sh: line 56: bc: command not found

local/score.sh: line 56: bc: command not found解决办法:yum install bc

2017-10-19 11:08:33 1384

原创 kaldi问题:queue.pl: error submitting jobs to queue

queue.pl: error submitting jobs to queue (return status was 32512)sh: 1: qsub: not found解决办法:打开cmd.shexport train_cmd=queue.plexport decode_cmd="queue.pl --mem 4G"export mkgr

2017-10-19 11:07:15 2139

转载 Linux命令之exit - 退出当前shell

用途说明exit命令用于退出当前shell,在shell脚本中可以终止当前脚本执行。 常用参数格式:exit n退出。设置退出码为n。(Cause the shell to exit with a status of n.) 格式:exit退出。退出码不变,即为最后一个命令的退出码。(If n is omitted, the exit

2017-10-19 10:02:37 12576

原创 声纹识别综述

声纹识别由三部分组成:特征,模型,得分。特征方面:MFCC/PLP/FBank等短时频谱特征;D-vector (谷歌2014年提的)Deep feature / Bottleneck feature /Tandem feature (三者不是并行关系,可以搜关键词查看相关论文)模型方面:GMM-UBMJFA (Joint Factor Analysis)GMM-UBM i

2017-10-10 17:40:48 6882 9

原创 使用darknet训练分类器

参考:https://pjreddie.com/darknet/train-cifar/1、在工程目录下新建labels.list,classifier 中train函数路径为了一致也要改动。labels.list内容如下:n00n01n022、在cfg文件夹下新建imagenet1k.data,用于指示路径等信息,内容如下:3、在工程项目目录下建立train文件夹

2017-10-09 18:12:06 5921 10

基于QT的二维码内容识别

可视化界面,简单易用,还可加入了裁剪图片等功能

2023-03-16

机器学习教材

该书介绍了机器学习的一些基本概念和方法

2016-06-12

Area Location Code

This code can be used to locate region we need in an image, so that we can abstract the domain we want to process.

2015-03-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除