![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
人工智能
少游223
语音识别算法
展开
-
wenet/utils/mask.py代码理解
本文主要是对wennet中wenet/utils/mask.py代码注解原创 2022-01-01 21:22:07 · 1752 阅读 · 0 评论 -
画频谱图+图中的y轴缩放,由1000改为1kHz
import waveimport numpy as npimport matplotlib.pyplot as pltimport matplotlib.patches as patchesfrom matplotlib.ticker import MultipleLocator, FormatStrFormatterfrom matplotlib.ticker import Func...原创 2020-05-07 12:29:11 · 919 阅读 · 0 评论 -
计算mcd值
cat test_data/corpus.lst | xargs python bin/get_mcd_dtw test_data/ref-examples test_data/synth-examples原创 2019-11-06 17:20:09 · 418 阅读 · 1 评论 -
283. Move Zeroes leetcode python #这个算法数字很的碉堡了
class Solution: def moveZeroes(self, nums: List[int]) -> None: """ Do not return anything, modify nums in-place instead. """ #这个算法nb了 zero = 0 # record...原创 2019-03-01 16:35:14 · 224 阅读 · 0 评论 -
刷leetcode的一些经典算法的记录
283. Move Zeroes #这个算法nb了 zero = 0 # records the position of "0" for i in range(len(nums)): if nums[i] != 0: #如果该位置不是0 nums[i], nums[zero] = nums[...原创 2019-03-01 16:37:16 · 288 阅读 · 0 评论 -
python画语音频谱图
import waveimport structfrom scipy import *import pyworld as pwfrom scipy.io import wavfileimport matplotlib.pyplot as pltimport numpy as npimport osimport soundfile as sf#读取wav文件root_wav...原创 2019-03-20 13:16:06 · 5564 阅读 · 0 评论 -
jupyter notebook 无法打开虚拟环境
conda install nb_conda_kernels原创 2019-03-20 13:35:05 · 2338 阅读 · 4 评论 -
python如何打开bson文件
import bsonbson_file = open('test.bson','rb')bson_data = bson.loads(bson_file.read())原创 2019-03-19 11:11:14 · 4965 阅读 · 6 评论 -
数据清洗步骤
1 去频次awk -F"\t" '{if($2>=500) print $1}' file > file_new2 clean_data.sh 需要修改待清洗文件 与生成文件3 给清洗后的文件加上class sed 's/^/CLASS-应用:&/g' test.file > new_file4 合成corpus generate_corpus.sh ...原创 2019-03-30 16:16:31 · 57 阅读 · 0 评论 -
3-28处理数据是awk cat shell等方式记
awk -F"\t" '{if($2>=500) print $1}' file > file_new这里F后面指定切分方式在每行的头添加字符,比如"HEAD",命令如下:sed 's/^/HEAD&/g' test.filecat file | sort -t $'\t' -k2 -n -r > newfile #以tab进行分割数据 ...原创 2019-03-28 17:34:27 · 347 阅读 · 0 评论 -
导入soundfile时提示 OSError: sndfile library not found
sudoapt-getinstall libsndfile1我第一遍安装libsndfile1,总是提示404ip无法访问,后来关机重启,就可以了。原创 2019-08-06 17:57:29 · 5154 阅读 · 0 评论 -
字节跳动的花园路径问题,偶数个圆上的点画不相交的直线有多少种画法
原创 2019-08-26 12:47:59 · 408 阅读 · 0 评论 -
python 自定义包的导入失败
检查我自定义的包与程序都在合适的位置,但是死活就是无法导入,最后才知道问题出在哪里?每一个包目录下面都会有一个__init__.py的文件,这个文件是必须存在的,否则,Python就把这个目录当成普通目录(文件夹),而不是一个包。__init__.py可以是空文件,也可以有Python代码,因为__init__.py本身就是一个模块,而它的模块名就是对应包的名字。调用包就是执行包下的__ini...原创 2019-02-18 14:34:15 · 3511 阅读 · 3 评论 -
python环境安装tlsh
https://github.com/trendmicro/tlsh上面的链接是官方的工具,trend micro的产品,在该链接介绍中有详细的安装介绍,不明白部分可以私我。原创 2019-02-18 12:32:49 · 874 阅读 · 0 评论 -
NLP中kaggle比赛实例《每日新闻对股票市场的预测》进阶版
这篇比基础版加了什么呢?基础版是直接将文本放入TF-IDF,虽然简单方便,但还是不够严谨,可以对数据进行进一步处理,如先小写化,将文本分成晓得tokens,接着删减如the,a,that等停止词,用正则化删除数字。用这些手段将数据进行处理。from sklearn.feature_extraction.text import CountVectorizer,TfidfVectorizerimpo...原创 2018-03-21 14:23:03 · 3424 阅读 · 3 评论 -
用Word2Vec来处理NLP问题
以下是主要代码,用word2vec来对词汇进行处理,只给了主要代码,其他读入和处理的代码在我博客里nlp处理的基础版和进阶版中都可以很容易查到。点击打开链接#训练NLP模型#先用最简单的Woed2Vecfrom gensim.models.word.2Vec import Word2Vecmodel = Word2Vec(corpus,size=128,windows=5,min_counts =...原创 2018-03-21 14:55:43 · 742 阅读 · 2 评论 -
用k最近邻、决策树和朴素贝叶斯比较分类效果
用三种分类方法,分别是k最近邻、决策树和朴素贝叶斯。画出数据点和决策边界,对比其区别。结果在最后的图中import numpy as npfrom numpy import *import matplotlib.pyplot as pltfrom sklearn.naive_bayes import GaussianNBfrom sklearn import metricsfrom s...原创 2018-04-13 20:30:51 · 5197 阅读 · 2 评论 -
yolov3使用总结
yolov3的效果比其他的模型要好很多,一共106层网络结构。处理一个视频通常fps可以达到22。如果用yolov3-tiny的话,这个模型是轻量级的,模型只有六七十层左右,速度会更好,当然这肯定会造成识别质量的下降。这个yolov3-voc可以识别20种物体,可以识别出红绿灯,但是红绿灯识别出来后无法对颜色进行判断,所以需要进行修改,同时把物体识别种类数减少,这样可以降低计算量。预先训练模型...原创 2018-10-17 15:10:37 · 106 阅读 · 0 评论 -
关于yolo3的红绿灯检测的结果优化
环境背景:当出现漏检,错检等情况时,原模型没有应对能力。比如,当连续出现10桢图片检测为红灯情况下,当第11桢图像误剑为绿灯时,原系统无法对该错检做出规避处理。所提出的优化方法就会自动过滤掉绿灯,仍然检测输出为红灯,但是在prediction处保存为绿灯,当第12桢图像为红灯时,该系统就可以恢复为红灯,中间的绿灯对输出效果没有影响。对于误检的情况来说,只有当之前设置的10桢图像中有超过...原创 2018-10-25 09:58:12 · 146 阅读 · 0 评论 -
用xgboost进行网格搜索与交叉验证时 出现的问题
cv_params = {'n_estimators': [6,10,20,50],'learning_rate':[0.1,0.01,0.05]}other_params = { 'max_depth': 5, 'min_child_weight': 1, 'seed': 0,'silent':0, 'subsample': 0.8, 'colsampl...原创 2018-12-28 14:36:18 · 2368 阅读 · 0 评论 -
pickle 文件的读取操作(可以较好地保存数据类型不改变)
f=open('C:\\Users\\-------\\Desktop\\' + 'pickle_A.dat','wb+')pickle.dump(coded_sps_A_norm,f)f.close f=open('C:\\Users\\-------\\Desktop\\' + 'pickle_A.dat','rb')import pickledata = pickle.loa...原创 2018-12-25 16:46:55 · 2262 阅读 · 0 评论 -
关于动态规划的详细解释
https://www.cnblogs.com/wuyuegb2312/p/3281264.html上面的链接给的是详细的动态规划例子与讲解,美中不足的是对于字符串相似度,也就是编辑距离这里讲的不是太明白,然后在下面的这篇文章中得到了很好的解释。https://www.cnblogs.com/xiaoyulong/p/8846745.html...原创 2019-01-07 18:23:55 · 173 阅读 · 0 评论 -
使用shuffle进行打乱数据的问题总结
最近在做xgboost分类的时候需要用到shuffle来打乱数据,但是遇到的问题是数据量太大所造成的当shuffle数据时程序会卡死,所以,我就先把pandas数据进行shuffle,然后再转换成numpy型数据: pua_data = np.array(shuffle(pua_data))后来在使用shuffle时用了np中的shuffle,造成的结果就是把数据全丢失了,当时用的是...原创 2019-01-08 09:41:31 · 3709 阅读 · 0 评论 -
lcs 用动态规划计算最长公共子序列 (python c)
伪代码如下:for x = 0 to n do for y = 0 to m do if (x == 0 || y == 0) then LCS(x, y) = 0 else if (Ax == By) then LCS(x, y) = LCS(x - 1,y - 1) + 1 else...转载 2019-01-08 10:11:42 · 275 阅读 · 0 评论 -
在运行Loaded runtime CuDNN library: 7103 (compatibility version 7100) but source was compiled with 7003
个人分析: 我是安装在conda的py36环境下,由于升级了torch到0.4.0,就出现这个情况,所以坑定不是我的驱动或者cudnn cuda的问题,试图恢复torch的版本,也尝试了去重装tensorflow-gpu,但是没有解决,网上看了,才升级tensorflow-gpu 之前的版本是1.7.0 升级后为1.8.0 可以正常使用。...原创 2019-01-23 09:48:20 · 591 阅读 · 0 评论 -
利用kNN算法对iris数据集进行分类,本人也做了修改使得代码可实现
from numpy import *import operatorfrom mpl_toolkits.mplot3d import Axes3Dimport matplotlib.pyplot as pltfrom matplotlib import cm#载入数据def file2matrix(fileName): file = open(fileName) al...转载 2018-03-03 15:56:11 · 5414 阅读 · 1 评论