瑶光light-CSDN博客

原创音频处理命令

ffmpeg -i 20171016test.mp3 -f wav “201710160test.wav”

2022-03-17 11:44:50 3457

import openpyxlwb = openpyxl.load_workbook('example.xlsx')# 从工作薄中获取一个表单(sheet)对象sheets = wb.sheetnamesprint(sheets, type(sheets))ws = wb.get_sheet_by_name('Sheet3')lng = ws.cell(i,3).value#获取i行3列的表格值ws.max_row和ws.max_column给出数据用到的最大行和列参考https://ww

2022-02-28 14:40:05 473

原创 tf.one_hot

什么是onehot:一位有效编码，对每一个样本，如果有n种类别，只有对应类别位置编码为1，其它为0 。ce 损失计算常常用到。tensorflow 函数tf.one_hot(indices,depth,on_value=None,off_value=None,axis=None,dtype=None,name=None)indices：样本类别集合depth：类别数on_value: 最大值，如果未指定，默认为1off_value: 最小值，如果未指定，默认为0on_value

2022-02-21 12:05:46 1159

原创乱七八糟的环境问题

CUDA_VISIBLE_DEVICES=0 python3 main.py

2022-02-18 15:25:40 740

原创语音识别原理与应用学习笔记

第12章端到端(E2E)语音识别CTC的前向后向算法可以引导输出序列与输入序列按时间顺序对齐，而Attention模型的对齐关系没有先后顺序的限制，完全靠数据驱动得到，难以训练。因此CTC和Attention模型各有优势，可把两者结合起来，构建Hybrid CTC/Attention模型，采用多任务学习，通过CTC避免对齐关系过于随机，以加快训练流程。...

2022-02-16 19:41:08 1602

原创 pytorch函数用法记录

1、torch.gathertensor.gatherA = B.gather(dim=0, index=torch.tensor([[2, 1, 2]]))为例，首先确定A的维度与index维度一致（index维度可以是任意的维度，不要受限于B），即A的维度为(1,3)；其次dim=0代表按列索引，那么index第一个元素“2”的含义为在B中其所在列（即第0列）的第2个元素。同理，index第二个元素“1”的含义为在B中其所在列（即第1列）的第1个元素；index第三个元素“2”的含义为在B中其所在列

2022-02-16 19:37:51 729

原创 asr资料汇总

人工智能 Kaldi中的FST及其可视化

2022-02-10 14:50:14 1575

原创调参问题汇总

loss不降https://blog.csdn.net/u010159842/article/details/83614791

2022-02-08 14:59:27 292

原创 tensorflow函数学习

tf.contrib.learn.ModelFnOps等价于tf.estimator.estimator_spec

2022-01-28 16:15:53 1799

转载 tf.contrib.training.bucket_by_sequence_length

tf.contrib.training.bucket_by_sequence_length( input_length, tensors, batch_size, bucket_boundaries, num_threads=1, capacity=32, bucket_capacities=None, shapes=None, dynamic_pad=False, allow_smaller_final_batch=False

2022-01-26 10:22:02 248

原创 NDArray和NumPy相互转换（mxnet）

将numpy 转换成NDArrayP = np.ones((2, 3))D = nd.array( P)反过来D.asnumpy()参考https://blog.csdn.net/heiheiya/article/details/86511873

2021-09-22 17:31:04 1469 1

原创 numpy

import numpy as np

2021-09-22 17:25:30 123

原创 ngram

ngram 理论知识工具使用得到ngramngram-count -order 3 -vocab wordlist -text corpus -lm 3gram -gt1min 1 -gt2min 1 -gt3min 1-help 帮助信息-version 版本信息-order 最大阶数-vocab 读取词典vocab_file。生成语言模型时，如果计数文件中或者训练文件中，如果出现了词典vocab_file之外的词（OOV)，则这些词会被替换为。-text 语料-lm 生成的语言模型

2021-09-22 16:46:35 430

原创 shell算术运算

val=expr 2 + 2echo"两数之和为 : val"表达式和运算符之间要有空格，例如2+2是不对的，必须写成2+2，这与我们熟悉的大多数编程语言不一样。完整的表达式要被‘‘包含，注意这个字符不是常用的单引号，在Esc键下边![在这里插入图片描述](https://img−blog.csdnimg.cn/2d6f5a88de4943b2b128a0f3586066e5.png?x−oss−process=image/watermark,typeZmFuZ3poZW5naGVpdGk,shadow1

2021-08-13 11:06:51 83

原创 tf.nn.sparse_softmax_cross_entropy_with_logits（）

第一步：Softmax第二步：Cross-Entropytf.nn.sparse_softmax_cross_entropy_with_logits(logits, labels, name=None)这里的labels的形状为[batch_size],也即长度为batch_size的一维向量。每一个值的取值范围是[0,num_class)。如果label 已经是one-hot格式，可以使用tf.nn.softmax_cross_entropy_with_logits()参考https:/

2021-08-10 10:57:01 190

原创 tf.contrib

tf.contrib.training.HParams[ tf.contrib.training.HParams](https://blog.csdn.net/SPESEG/article/details/106386229) tf.contrib.training.HParams看起来很厉害，其实貌似是个字典。。。>>> ccc=tf.contrib.training.HParams(name='xmg',loc='Peking',dnn='RecSys')>>&gt

2021-05-18 11:03:50 525

原创 shell常用命令

linux下批量杀死进程（使用了xargs）ps-aux | grepping6 | cut -c 9-15 | xargskill -9cut -c 9-15是截取上面输出的结果中的进程号，9-15正好是进程号Shell 基本运算符原生bash不支持简单的数学运算，但是可以通过其他命令来实现，例如 awk 和 expr，expr最常用。expr是一款表达式计算工具，使用它能完成表达式的求值操作。例如，两个数相加(注意使用的是反引号 ` 而不是单引号 ')#!/bin/bashval=exp

2021-04-11 17:56:28 364

原创 YOLOv4

一、简介很多特征都有助于提升CNN的精度。有一些特征只对特定的模型，特定的问题或者小尺度的数据集有效果，有一些特征可应用于大多数模型，任务和数据集。文章中认为几种特征比较通用：加权残差法Weighted-Residual-Connections (WRC), Cross-Stage-Partial-connections (CSP), Cross mini-Batch Normalization (CmBN), Self-adversarial-training (SAT) and Mish-activa

2021-04-11 17:21:21 781

weixin_39780859的博客

原创 attention 笔记