自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (1)
  • 收藏
  • 关注

原创 logsumexp与路径概率

ctc、crf等与路径相关模型中经常会计算路径概率,本文简单介绍logsumexp函数使用,并且它与计算概率路径的关系

2022-04-20 09:46:38 473 1

原创 Python元组赋值顺序问题

1.元组赋值python支持元组赋值,这使得交换两个变量的值非常简单a = 1b = 2a, b = b, a # 此时a为2, b为12.元组赋值的顺序问题在大部分情况下,这种元组赋值是没有问题的,但是如果交换的变量存在关联,看下面例子,这种情况下链式赋值就是有顺序的。下面例子中,注意L是[10, 888, 30, 40]而不是[888, 20, 30, 40]。k = 0l = [10, 20, 30, 40]k, l[k] = 1, 888 # 此时k为1,l为[10, 888,

2021-06-18 10:13:50 1421 1

原创 tensorflow源码编译whl安装文件

1.首先安装bazel如果linux系统上没有bazel,可参考https://blog.csdn.net/qq_41204464/article/details/95333396进行安装。建议采用“用二进制安装程序安装”2.下载tensorflow源文件从https://github.com/tensorflow/tensorflow/tags中选择需要编译的tensorflow版本3.配置tensroflow库进入tensorflow源码根目录,运行 ./configure 进行配置

2021-02-03 16:28:50 995 5

转载 MNN安装报错集锦

1.MNN下载地址https://github.com/alibaba/MNN2.参考博主https://blog.csdn.net/ab0902cd/article/details/996914432_1.出现问题:versions.proto:1:10: Unrecognized syntax identifier "proto3". This parser only recognizes "proto2".参考博主https://blog.csdn.net/Ambitio.

2021-01-20 16:54:10 542

原创 Gunicorn服务报错-WORKER TIMEOUT

1.报错还原在使用gunicorn部署flask程序时常常会出现WORKER TIMEOUT报错,如下图,接着,挂掉的worker又自动重启。虽然进程(worker)挂掉后会自动重启,对于一些启动耗时较短的程序没有问题,但是对于深度学习模型等启动较慢的程序这就比较影响请求响应速度了。2.解决办法先直接说下解决办法,然后分析原因,直接将gunicorn的参数配置中的timeout参数设置大一点即可,超时参数设置格式为"-t 超时时间(单位是秒)",示例:gunicorn -w 2 -t 50

2020-11-24 09:36:35 7126

原创 Sentiment140情感分类数据

下载链接:https://www.kaggle.com/kazanova/sentiment140

2020-10-22 17:19:13 910

原创 tf.clip_by_norm和tf.clip_by_global_norm区别

1.tf.clip_by_normclip_by_norm(t, clip_norm, axes=None, name=None)t: 输入tensor,也可以是list clip_norm: 一个具体的数,如果l2norm(t) ≤ clip_norm, 则t不变化;否则t=t∗clip_norm / l2norm(t) axes:指定计算l2norm的维度,如果不指定,利用t中所有元素计算l2norm,对于一维tensor没有影响,对于二维tensor会有影响让我们看一个具体的例子:对

2020-09-16 09:58:13 1136

原创 中文文本纠错论文解读——Adaptable Filtering using Hierarchical Embeddings for Chinese Spell Check

原始论文:https://arxiv.org/abs/2008.122811.纠错整体结果本文的纠错结构比较简单,如下图,利用bert对一个包含错误句子中的每一个词进行预测,然后利用过滤器对结果进行过滤,由于“五”和“一”不存在任何音似或形似的地方,所以“一”的位置不进行修改,这就是本文纠错的思路,非常简单吧 2.Head Filt 过滤器本文的亮点就在与过滤器上,本文的过滤器实际上就是一个混淆集,只不过与之前的固定混淆集不同,本文的混淆集能够通过相...

2020-09-15 11:45:55 433

原创 python循环使用正则表达式匹配速度慢

1.问题描述现在有一系列的模糊匹配规则,需要对一个文档中的每一个句子利用每一个匹配规则进行正则匹配,具体代码如下:# sentences为句子列表# re_str为正则表达式列表,其中元素类似 "^你好&" 这种正则表达式for sent in sentences: for pattern in re_str: if re.findall(pattern, sent): print(sent) break代码

2020-08-18 09:40:46 3444

原创 tensorflow.data.Dataset中batch、shuffle、repeat作用及不同顺序的区别

1.作用dataset.shuffle作用是将数据进行打乱操作,传入参数为buffer_size,改参数为设置“打乱缓存区大小”,也就是说程序会维持一个buffer_size大小的缓存,每次都会随机在这个缓存区抽取一定数量的数据 dataset.batch作用是将数据打包成batch_size dataset.repeat作用就是将数据重复使用多少epoch2.各种不同顺序的区别示例代码(以下面代码作为说明):# -*- coding: utf-8 -*-import tensorfl

2020-06-01 17:08:16 3048 2

原创 详解kenlm语言模型计算过程

1.kenlm在python中的使用过程import kenlmmodel = kenlm.language("tri_gram_language_model.arpa")score = model.score("银行 放贷 行为")print(score) --------------------------------->>> -7.15396165847...

2020-04-27 09:13:59 2234 6

原创 英文标点符号unicode

1.英文标点符号包括以下字符[' ', '!', '"', '#', '$', '%', '&', "'", '(', ')', '*', '+', ',', '-', '.', '/', ':', ';', '<', '=', '>', '?', '@', '[', '\', ']', '^', '_', '`', '{', '|', '}', '~']...

2020-04-26 17:39:11 4162

原创 tensorflow模型恢复报错:ValueError: No variables to save

1.现象说明tensorflow恢复训练好的参数进行推理时出现以下报错(图1所示) 图12.原因分析根据报错提示,是在创建saver对象时出错,具体错误是...

2020-04-23 09:56:33 10915

原创 pycorrector安装失败、kenlm安装失败,提示LINK : fatal error LNK1181: cannot open input file 'stdc++.lib'

1.现象描述使用pip install pycorector、或则单独pip install kenlm时,报错如下错误LINK : fatal error LNK1181: cannot open input file 'stdc++.lib'2.错误原因安装kenlm时出现错误3.解决办法1.步骤1——拷贝两个文件将C:\Program Files (x86)\W...

2020-04-20 18:07:12 1300 7

原创 Pyinstaller打包spacy库时失败

1.问题描述在使用pyinstaller打包包含spacy库的文件时出错,点击可执行文件exe时,程序闪退,通过在cmd中输入“.\文件名.exe”可以看到具体错误的原因,全部都是提示类似这样的错误“”,如下图所示2.问题分析首先查看了spacy的依赖库,如图2所示,发现是spacy有很多依赖库,而提示的错误基本也都是这些依赖库的问题,所以最后发现问题原因就是在主程序中没有显示的导入这些依...

2020-04-09 10:42:35 872

官方bert中文预训练模型

Google官方中文Bert预训练模型,当前模型为bert base模型,省去爬梯下载的烦恼,需要其他模型的可以私信

2020-08-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除