自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

街道口扛把子的博客

学习Qt,NLP(python+pytorch+AllenNLP),opencv

  • 博客(10)
  • 资源 (8)
  • 收藏
  • 关注

原创 AllenNLP使用Predictor进行预测

在租的服务器上训练了预置的bidaf,把这两个文件拷到了自己这边:其中model.tar中有三个文件,词典,模型配置文件,权重文件。词典中有97320个词,还记录了不填充的namespace “tags和labels”用 BidafPredictor 使用model.tar.gz文件进行预测。文章和问题用的SQuAD1.1 dev的第一篇文章,我把文章放到了spacy.txt,问题直接输入...

2019-01-29 20:08:23 3227

原创 matplotlib的示例中一个很好看的文本相似矩阵图

import numpy as npimport matplotlibimport matplotlib.pyplot as plt# sphinx_gallery_thumbnail_number = 2vegetables = ["cucumber", "tomato", "lettuce", "asparagus", "potato", "wheat&qu

2019-01-29 00:32:55 1106

原创 AllenNLP常用命令记录

allennlp train ./config_dir -s ./save_dir -r, --recover recover training from the state in serialization_dir -f, --force overwrite the output directory if it exists -o OVERRIDE...

2019-01-27 12:24:02 1519

原创 文本attention矩阵可视化

在机器阅读理解的论文中,经常可以看到对“文章-问题”可视化的二维热力图,例如下图。在看实验结果的时候用这种图可以直观的看到attention的效果怎么样。比如下图:于是从github中找到了一个例子,进行了简单的实验。import numpy as npimport matplotlib.pyplot as pltimport pandas as pdimport matplotlib...

2019-01-27 11:28:52 16764 1

原创 AllenNLP文本数据预处理类关系图

NLP的文本预处理需要经过分词,建立词典,单词转索引值,转tensor,AllenNLP定义了若干类处理这一过程,因此我用图的方式记录这些类的关系,将重要的几点标红,这样看着清楚。参考allennlp/tutorials/notebooks/中的示例。...

2019-01-25 17:05:08 599

原创 AllenNLP训练的方式

前几天看到一个群里有人问,AllenNLP在控制台使用命令train时,什么时候建立的词典,于是今天浏览了一下AllenNLP的代码。在train.py的class Train(Subcommand):类里,这里用parser定义了一些命令行的输入指令。在控制台输入allennlp train XXX -s XXX之后,读取配置文件.json,然后进入到train_model(params, ...

2019-01-25 10:44:08 1508

原创 机器阅读理解数据集

前几天阅读了几篇阅读理解数据集的论文,在这里简要记录。下图是QuAC论文里的。

2019-01-20 14:56:53 1739

原创 NLP的强大工具——AllenNLP

学习NLP,推荐一下AllenNLP这个工具。从学习pytorch到学习处理NLP问题,中间有很长的路要走,其中有很多坑。NLP数据的预处理要比CV的麻烦很多,比如去除停用词,建立词典,加载各种预训练词向量,Sentence -> Word ID -> Word Embedding的过程(文本预处理方法小记)。用到RNN时,还要经过pad,pack,pad的过程。还有数据集的读取,t...

2019-01-17 16:00:49 13239 2

原创 算法入门

2019-01-02 17:40:01 125

原创 修电脑的通用方法汇总

本教程的目的教大家如何快速地修好自己的电脑,对于计算机新手来说简直是福音!计算机初学者可以通过学习此教程,迅速入门,光荣地成为一名初级程序员。一个男生,会修电脑真的是最重要的技能好伐,如果有个铝海纸找你修电脑的话,那你就可以修一下你的技术了,修电脑的技术。以下是博主通过多年使用计算机总结出来的,修电脑大法:。。。。。。。。。。。。。。。。。一、重启平时很多...

2019-01-02 17:35:54 562 4

opencv4.5的dnn_text_spotting模型文件下载

opencv4.5新更新的TextRecognitionModel和TextDetectionModel_DB的onnx模型文件,包含DB_TD500_resnet18.onnx,DB_TD500_resnet50.onnx,crnn_cs_CN.onnx和alphabet_3944.txt

2020-12-23

rdn-liif.rar

Learning Continuous Image Representation with Local Implicit Image Function (LIIF) 的预训练模型文件,包含EDSR-baseline-LIIF和RDN-LIIF

2020-12-23

pse_sim.onnx

pytorch.PSENet训练好的模型文件转换为onnx格式文件,可使用ncnn,onnx-runtime等方式部署

2020-05-19

ncnn-android-lib.zip

ncnn 是一个为手机端极致优化的高性能神经网络前向计算框架。ncnn-android-lib是ncnn编译好的android lib,可以直接使用

2020-05-19

protoc-3.12.0-win64.zip

protobuf的release包 protoc-3.12.0-win64 下载,用于windows系统

2020-05-18

protobuf-cpp-3.12.0.tar.gz

Protocol Buffers v3.12.0 release包,下载速度好慢,好不容易下载下来的,分享一下

2020-05-18

nvidia_dali-0.21.0-1239037-cp37-cp37m-manylinux1_x86_64.whl

NVIDIA开源的DALI的whl包,用于linux-python3.7,版本0.21.0。 国内下载很慢,用了好长时间才下载下来的,分享一下。

2020-05-05

Quora Question Pairs数据集

判断两个问题句是否表达一个意思。包含 "id","qid1","qid2","question1","question2","is_duplicate"

2019-07-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除