自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 attention 笔记

attention 笔记

2022-07-08 16:44:37 678 1

原创 音频处理命令

ffmpeg -i 20171016test.mp3 -f wav “201710160test.wav”

2022-03-17 11:44:50 3430

原创 python读取excel

import openpyxlwb = openpyxl.load_workbook('example.xlsx')# 从工作薄中获取一个表单(sheet)对象sheets = wb.sheetnamesprint(sheets, type(sheets))ws = wb.get_sheet_by_name('Sheet3')lng = ws.cell(i,3).value#获取i行3列的表格值ws.max_row和ws.max_column给出数据用到的最大行和列参考https://ww

2022-02-28 14:40:05 454

原创 tf.one_hot

什么是onehot:一位有效编码,对每一个样本,如果有n种类别,只有对应类别位置编码为1,其它为0 。ce 损失计算常常用到。tensorflow 函数tf.one_hot(indices,depth,on_value=None,off_value=None,axis=None,dtype=None,name=None)indices:样本类别集合depth:类别数on_value: 最大值,如果未指定,默认为1off_value: 最小值,如果未指定,默认为0on_value

2022-02-21 12:05:46 1125

原创 乱七八糟的环境问题

CUDA_VISIBLE_DEVICES=0 python3 main.py

2022-02-18 15:25:40 718

原创 语音识别原理与应用学习笔记

第12章 端到端(E2E)语音识别CTC的前向后向算法可以引导输出序列与输入序列按时间顺序对齐,而Attention模型的对齐关系没有 先后顺序的限制,完全靠数据驱动得到,难以训练。因此CTC和Attention模型各有优势,可把两者结 合起来,构建Hybrid CTC/Attention模型,采用多任务学习,通过CTC避免对齐关系过于随机,以加快 训练流程。...

2022-02-16 19:41:08 1543

原创 pytorch函数用法记录

1、torch.gathertensor.gatherA = B.gather(dim=0, index=torch.tensor([[2, 1, 2]]))为例,首先确定A的维度与index维度一致(index维度可以是任意的维度,不要受限于B),即A的维度为(1,3);其次dim=0代表按列索引,那么index第一个元素“2”的含义为在B中其所在列(即第0列)的第2个元素。同理,index第二个元素“1”的含义为在B中其所在列(即第1列)的第1个元素;index第三个元素“2”的含义为在B中其所在列

2022-02-16 19:37:51 703

原创 asr资料汇总

人工智能 Kaldi中的FST及其可视化

2022-02-10 14:50:14 1529

原创 调参问题汇总

loss不降https://blog.csdn.net/u010159842/article/details/83614791

2022-02-08 14:59:27 281

原创 tensorflow函数学习

tf.contrib.learn.ModelFnOps等价于tf.estimator.estimator_spec

2022-01-28 16:15:53 1763

转载 tf.contrib.training.bucket_by_sequence_length

tf.contrib.training.bucket_by_sequence_length( input_length, tensors, batch_size, bucket_boundaries, num_threads=1, capacity=32, bucket_capacities=None, shapes=None, dynamic_pad=False, allow_smaller_final_batch=False

2022-01-26 10:22:02 221

原创 NDArray和NumPy相互转换(mxnet)

将numpy 转换成NDArrayP = np.ones((2, 3))D = nd.array( P)反过来D.asnumpy()参考https://blog.csdn.net/heiheiya/article/details/86511873

2021-09-22 17:31:04 1393 1

原创 numpy

import numpy as np

2021-09-22 17:25:30 101

原创 ngram

ngram 理论知识工具使用得到ngramngram-count -order 3 -vocab wordlist -text corpus -lm 3gram -gt1min 1 -gt2min 1 -gt3min 1-help 帮助信息-version 版本信息-order 最大阶数-vocab 读取词典vocab_file。生成语言模型时,如果计数文件中或者训练文件中,如果出现了词典vocab_file之外的词(OOV),则这些词会被替换为。-text 语料-lm 生成的语言模型

2021-09-22 16:46:35 395

原创 shell算术运算

val=expr 2 + 2echo"两数之和为 : val"表达式和运算符之间要有空格,例如2+2是不对的,必须写成2+2,这与我们熟悉的大多数编程语言不一样。完整的表达式要被‘‘包含,注意这个字符不是常用的单引号,在Esc键下边![在这里插入图片描述](https://img−blog.csdnimg.cn/2d6f5a88de4943b2b128a0f3586066e5.png?x−oss−process=image/watermark,typeZmFuZ3poZW5naGVpdGk,shadow1

2021-08-13 11:06:51 72

原创 tf.nn.sparse_softmax_cross_entropy_with_logits()

第一步:Softmax第二步:Cross-Entropytf.nn.sparse_softmax_cross_entropy_with_logits(logits, labels, name=None)这里的labels的形状为[batch_size],也即长度为batch_size的一维向量。每一个值的取值范围是[0,num_class)。如果label 已经是one-hot格式,可以使用tf.nn.softmax_cross_entropy_with_logits()参考https:/

2021-08-10 10:57:01 169

原创 tf.contrib

tf.contrib.training.HParams[ tf.contrib.training.HParams](https://blog.csdn.net/SPESEG/article/details/106386229) tf.contrib.training.HParams看起来很厉害,其实貌似是个字典。。。>>> ccc=tf.contrib.training.HParams(name='xmg',loc='Peking',dnn='RecSys')>>&gt

2021-05-18 11:03:50 496

原创 shell常用命令

linux下批量杀死进程(使用了xargs)ps-aux | grepping6 | cut -c 9-15 | xargskill -9cut -c 9-15是截取上面输出的结果中的进程号,9-15正好是进程号Shell 基本运算符原生bash不支持简单的数学运算,但是可以通过其他命令来实现,例如 awk 和 expr,expr最常用。expr是一款表达式计算工具,使用它能完成表达式的求值操作。例如,两个数相加(注意使用的是反引号 ` 而不是单引号 ')#!/bin/bashval=exp

2021-04-11 17:56:28 334

原创 YOLOv4

一、简介很多特征都有助于提升CNN的精度。有一些特征只对特定的模型,特定的问题或者小尺度的数据集有效果,有一些特征可应用于大多数模型,任务和数据集。文章中认为几种特征比较通用:加权残差法Weighted-Residual-Connections (WRC), Cross-Stage-Partial-connections (CSP), Cross mini-Batch Normalization (CmBN), Self-adversarial-training (SAT) and Mish-activa

2021-04-11 17:21:21 752

转载 ocr常用数据集介绍

Chinese Text in the Wild (CTW data)32,285 张图像和 1,018,402 个中文字符,来源于腾讯街景。图像大小2048*2048,数据集大小为31GB。ICPR WTMI2018中文数据集(天池比赛数据集)20000张图像。中英文混合。背景复杂。文件大小为2GB。ICDAR数据集ICDAR 2017 RCTW,主要是中文,共12263张图像。数据集绝大多数是相机拍的自然场景,一些是屏幕截图;包含了大多数场景,如室外街道、室内场景、手机截图等等Reading

2021-01-24 16:25:50 3217

原创 linux常用操作

2021-01-24 14:14:16 58

原创 python知识点集锦一(小甲鱼python课后练习题)

0. Python 是什么类型的语言脚本语言。一个脚本可以使得本来要用键盘进行的相互式操作自动化。 一个 Shell 脚本主要由原本需要在命令行输入的命令组成,或在一个文本编辑器中,用户可以使用脚本来把一些常用的操作组合成一组串行。特点:1语法和结构通常比较简单2学习和使用通常比较简单3通常以容易修改程序的“解释”作为运行方式,而不需要“编译”4程序的开发产能优于运行性能1. ...

2020-02-21 21:08:02 476

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除