自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 NLTK结合stanfordnlp工具包使用方法总结

简述 NLTK 是一款著名的 Python 自然语言处理(Natural Language Processing, NLP)工具包,在其收集的大量公开数据集、模型上提供了全面、易用的接口,涵盖了分词、词性标注(Part-Of-Speech tag, POS-tag)、命名实体识别(Named E...

2019-03-06 01:20:22

阅读数 1583

评论数 3

转载 Speech and Natural Language Processing相关资源列表

Refer tohttps://github.com/edobashira/speech-language-processing A curated list of speech and natural language processing resources. Other lists can...

2019-03-04 20:55:40

阅读数 300

评论数 0

转载 Lucene的各中文分词比较

对几种中文分析器,从分词准确性和效率两方面进行比较。分析器依次为:StandardAnalyzer、ChineseAnalyzer、 CJKAnalyzer、IK_CAnalyzer、MIK_CAnalyzer、MMAnalyzer(JE分词)、PaodingAnalyzer。 单纯的中文分词的...

2017-05-04 14:37:17

阅读数 1253

评论数 0

原创 Jupyter notebook 报错 500 : Internal Server Error的解决方法

问题: 输入jupyter notebook后再浏览器点击.ipynb文件报错500 Internal Server Error,异常如下图所示 解决方法: 1). 先卸载jupyter并删除安装目录下的以jupyter开头的文件,再重新pip install jupyter...

2020-02-26 09:56:45

阅读数 30

评论数 0

原创 解决问题module 'tensorflow.compat.v2' has no attribute 'contrib'和ImportError cannot import name 'auto'

Error: 当前tensorflow的版本是1.13.1和2.0.0b1报错module 'tensorflow.compat.v2' has no attribute 'contrib', 尝试用import tensorflow.compat.v1...

2020-02-04 11:45:10

阅读数 416

评论数 0

原创 ModuleNotFoundError: no module named 'pip'解决方法

问题:Python3.6版执行命令行 pip install --upgrade pip升级pip后, 再安装numpy时报错ModuleNotFoundError,如下图所示 解决方法: 在控制台输入以下命令后即可解决 python -m ensurepip 正确的升级...

2019-10-24 17:15:05

阅读数 336

评论数 0

原创 解决UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 212: illegal multibyte sequence

问题: 在cmd命令行输入python后报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 212: illegal multibyte sequence 分析: 读取文件时...

2019-10-11 00:51:03

阅读数 57

评论数 0

原创 解决ModuleNotFoundError: No module named 'numpy.core._multiarray_umath'的方法

问题: 导入tensorflow时报错ModuleNotFoundError: No module named 'numpy.core._multiarray_umath',异常信息如下所示 分析: NumPy是使用Python进行科学计算的基础软件包,这里提...

2019-10-10 15:15:50

阅读数 229

评论数 0

转载 Bert资源整理

转载自:https://mp.weixin.qq.com/s/q5OyrIycfN4fjQ33uSRmEA 整理一下BERT相关的资源,包括Paper, 代码和文章解读。 1、Google官方: 1)BERT: Pre-training of Deep Bidirectional Trans...

2019-07-26 01:51:23

阅读数 158

评论数 0

转载 BERT模型深度解析

转载自: https://blog.csdn.net/qq_39521554/article/details/83062188 github:NLP-BERT--Python3.6-pytorch 一、前言 去年谷歌AI团队新发布的BERT模型,在机器阅读理解顶级水平测试SQuAD1...

2019-07-26 01:48:27

阅读数 581

评论数 0

转载 概率语言模型3——训练工具汇总

转载自https://www.itread01.com/content/1547467935.html 傳統演算法 1) BerkeleyLM 是用java寫的,號稱跟KenLM差不多,記憶體比srilm小 https://github.com/adampauls/berkeleylm ...

2019-07-03 14:16:22

阅读数 163

评论数 0

转载 Redis v.s Memcache

转载自https://www.cnblogs.com/457248499-qq-com/p/7392653.html 观点一: 1、Redis和Memcache都是将数据存放在内存中,都是内存数据库。不过memcache还可用于缓存其他东西,例如图片、视频等等; 2、Redis不仅仅支持...

2019-06-24 14:28:16

阅读数 23

评论数 0

转载 Lecture 01-05 Basic —— Hinton课程

转载自https://www.cnblogs.com/jesse123/p/7131929.html Link:Neural Networks for Machine Learning -多伦多大学 Link:Hinton的CSC321课程笔记1 Link:Hinton的CSC321课程笔记...

2019-06-22 14:59:08

阅读数 38

评论数 0

转载 搜索引擎系统的原理和实践

转载自https://www.cnblogs.com/binyue/p/3464052.html 搜索引擎的原理和分析指标 (1)搜索引擎的工作原理 搜索引擎的工作原理大致可以分为: 搜集信息:搜索引擎的一个部分可以实现信息自动搜集。 整理信息:搜索引擎通过创建索引为抓取到的信息添加规则。 ...

2019-06-21 10:16:10

阅读数 513

评论数 0

转载 lecture15 自动编码器、语义哈希、图像检索——Hinton课程

转载自https://www.cnblogs.com/shouhuxianjian/p/4529167.html Hinton第15课,本节有课外读物《Semantic Hashing》和《Using Very Deep Autoencoders for Content-Based Image ...

2019-06-21 01:26:29

阅读数 49

评论数 0

转载 lecture16 联合模型、分层坐标系、超参数优化及本课未来的探讨——Hinton课程

转载自https://www.cnblogs.com/shouhuxianjian/p/4529166.html 这是HInton的第16课,也是最后一课。 一、学习一个图像和标题的联合模型 在这部分,会介绍一些最近的在学习标题和描述图片的特征向量的联合模型上面的工作。在之前的lectu...

2019-06-21 01:23:50

阅读数 119

评论数 0

转载 lecture14 RBM的堆叠、修改以及DBN的决策学习和微调——Hinton课程

转载自https://www.cnblogs.com/shouhuxianjian/p/4529168.html 这是Hinton的第14课,主要介绍了RBM和DBN的东西,这一课的课外读物有三篇论文《Self-taught learning- transfer learning from un...

2019-06-21 01:21:19

阅读数 81

评论数 0

转载 Lecture 13 BP算法的讨论和置信网——Hinton课程

转载自https://www.cnblogs.com/shouhuxianjian/p/4529169.html 这是HInton课程第13课,这一课有两篇论文可以作为课外读物《Connectionist learning of belief networks》和《The wake-sleep ...

2019-06-21 01:17:19

阅读数 61

评论数 0

转载 Lecture 09 & 10 Bayesian——Hinton课程

Link:Neural Networks for Machine Learning -多伦多大学 Link:Hinton的CSC321课程笔记 Lecture 09 Lecture 10 提高泛化能力 介绍不同的方法去控制网络的数据表达能力,并介绍当我们使用这样一种方法的时候如何...

2019-06-21 01:12:31

阅读数 79

评论数 0

转载 Lecture 06 Converage——Hinton课程

转载自https://www.cnblogs.com/jesse123/p/7171027.html Link:Neural Networks for Machine Learning -多伦多大学 Link:Hinton的CSC321课程笔记 Ref:神经网络训练中的Tricks之高效BP...

2019-06-21 01:03:49

阅读数 316

评论数 0

转载 Lecture 07 & 08 RNN---Hinton课程

转载自https://www.cnblogs.com/jesse123/p/7181320.html Link:Neural Networks for Machine Learning -多伦多大学 Link:Hinton的CSC321课程笔记 补充: 参见cs231n 2017版本,pp...

2019-06-21 00:57:40

阅读数 22

评论数 0

转载 Lecture 11 & 12 Hopfield Nets and Boltzmann Machine——Hinton课程

转载自https://www.cnblogs.com/jesse123/p/7193308.html 注:部分课件源于Hinton的课程 Neural Networks for Machine Learning 之Hopfield Nets 和Boltzmann Machine Lecture...

2019-06-21 00:51:20

阅读数 57

评论数 0

原创 Pytorch实现一个用于学习正态分布的GAN网络

2014 年,Ian Goodfellow 和他在蒙特利尔大学的同事发表了一篇震撼学界的论文《Generative Adversarial Nets》,这标志着生成对抗网络(GAN)的诞生,而这是通过对计算图和博弈论的创新性结合。研究显示:给定充分的建模能力,两个博弈模型能够通过简单的反向传播(b...

2019-05-27 20:56:49

阅读数 87

评论数 0

原创 解决ValueError: Variable model/wpe already exists,reuse=True or reuse=tf.AUTO_REUSE in VarScope

训练gpt2时出现的问题,报错信息如下图所示: 详细信息为: ValueError: Variable model/wpe already exists, disallowed. Did you mean to set reuse=True or reuse=tf.AUTO_REUSE i...

2019-05-27 15:20:43

阅读数 330

评论数 1

转载 Pytorch常用技巧

转载自https://www.pytorchtutorial.com/pytorch-goodies/ 本文总结了一些网上大家贡献的 PyTorch 编程技巧、常见代码等,包含模型统计数据、参数初始化、参数正则化等常用方法。如果你在 PyTorch 编程中刚好遇到这些问题,希望这篇总结能帮助...

2019-05-24 21:07:02

阅读数 142

评论数 0

原创 Pytorch实现二分类器

以下我们用 PyTorch 实现一个很简单的二分类器,所用的数据来自 Scikit learn。 首先来生成含200个样本的数据,并绘制出样本的散点图如下图所示: import matplotlib.pyplot as plt from sklearn.cluster import Spec...

2019-05-24 20:40:41

阅读数 1900

评论数 0

转载 Redis常用命令参考

转载自:https://kefeng.wang/2017/08/16/redis-command/ Redis 命令可以直接在 Redis 命令行中执行,用于管理员维护服务器或开发人员维护数据。Redis 命令很庞杂,本文把它们按用途分类并进行了关键说明,便于对比记忆,也便于管理人员和开发人员有...

2019-05-20 23:35:06

阅读数 26

评论数 0

原创 FlyAI平台竞赛入门记录

FlyAI算法竞赛平台官方介绍如下: FlyAI是隶属于北京智能工场科技有限公司旗下,为AI开发者 (深度学习)提供数据竞赛并支持GPU离线训练的一站式服务平台。每周免费提供项目开源算法样例,样例所使用开发框架涉及TensorFlow、Keras、PyTorch. 支持算法能力变现以及快速的迭...

2019-05-06 11:26:13

阅读数 2041

评论数 0

原创 Flutter中模拟器无法启动的解决方法

执行命令flutter emulators --launch Pixel2后报错如下: Failed to launch emulator: RegGetValueW failed 2 绯荤粺鎵句笉鍒版寚瀹氱殑鏂囦欢銆? emulator: ERROR: x86 emulation curren...

2019-05-05 20:15:03

阅读数 2830

评论数 0

原创 词向量 — word2vec

自然语言是一套用来表达含义的复杂系统。在这套系统中,词是表义的基本单元。在机器学习中,如何使用向量表示词? 顾名思义,词向量是用来表示词的向量,通常也被认为是词的特征向量。近年来,词向量已逐渐成为自然语言处理的基础知识。 为何不采用one-hot向量 我们在循环神经网络中介绍过one-hot...

2019-04-09 22:47:50

阅读数 149

评论数 0

原创 pytorch 1.1.0升级

Pytorch 1.1.0 Pytorch 1.1.0于2019-05-01发布,详情见https://github.com/pytorch/pytorch/releases/tag/v1.1.0 注: 不再支持CUDA8.0 概述:官方TensorBoard支持,属性,字典,列表和JIT ...

2019-04-09 22:45:41

阅读数 5109

评论数 0

原创 bert-embedding 安装及使用入门

安装 pip install bert-embedding #如果要使用GPU pip install mxnet-cu92 Note: 1. 安装过程中如果遇到WinError 5的权限问题,需要添加--user参数,即pip install --user mxnet-cu92 2....

2019-03-28 22:21:00

阅读数 1364

评论数 0

原创 WinError 解决方法汇总

WinError 2 文件找不到 解决方法:下载Microsoft Visual C++ 14.0安装包,再重新pip install torch_geometric, torch_scatter等 WinError 5 拒绝访问 解决方法:由权限问题引起的,加上参数--user,...

2019-03-28 19:38:00

阅读数 555

评论数 0

转载 Java垃圾回收机制

转载自https://blog.csdn.net/zsuguangh/article/details/6429592 1. 垃圾回收的意义   在C++中,对象所占的内存在程序结束运行之前一直被占用,在明确释放之前不能分配给其它对象;而在Java中,当没有对象引用指向原先分配给某个对象的内存时,...

2019-03-22 11:13:52

阅读数 150

评论数 0

原创 BFPRT算法

经典算法----BFPRT算法。 1973 年, Blum 、 Floyd 、 Pratt 、 Rivest 、 Tarjan 集体出动,合写了一篇题为 “Time bounds for selection” 的论文,给出了一种在数组中选出第 k 大元素的算法,俗称"中位数之中位数算法...

2019-03-21 13:12:37

阅读数 153

评论数 0

原创 全卷积网络FCN---Gluon

全卷积网络(fully convolutional network,FCN)采用卷积神经网络实现了从图像像素到像素类别的变换 。与之前介绍的卷积神经网络有所不同,全卷积网络通过转置卷积(transposed convolution)层将中间层特征图的高和宽变换回输入图像的尺寸,从而令预测结果与输入...

2019-03-20 18:13:56

阅读数 241

评论数 2

原创 词向量 — GloVe和fastText

本文介绍两种词向量:它们分别是2014年由Stanford团队发表的GloVe和2017年由Facebook团队发表的fastText。 GloVe GloVe使用了词与词之间的共现(co-occurrence)信息。我们定义XX为共现词频矩阵,其中元素xijxij为词jj出现在词ii的环境(...

2019-03-19 00:44:48

阅读数 248

评论数 0

原创 编码器—解码器和注意力机制

在基于词语的语言模型中,我们使用了循环神经网络。它的输入是一段不定长的序列,输出却是定长的,例如一个词语。然而,很多问题的输出也是不定长的序列。以机器翻译为例,输入是可以是英语的一段话,输出可以是法语的一段话,输入和输出皆不定长,例如 英语:They are watching. 法语:Ils...

2019-03-19 00:39:04

阅读数 1350

评论数 0

原创 解决Graphviz中文乱码问题

问题描述: 使用Graphviz绘制中文依存句法分析树的时候发现输出的中文结点乱码,不能正常显示中文,如下图所示: 分析: Graphviz绘图时所使用的语言叫作"dot"。使用dot语言,第一步就是决定要画哪种图。图分两种:有向图与无向图。 有向图以digraph...

2019-03-14 19:14:21

阅读数 1853

评论数 0

原创 Graphviz安装配置及入门

Graphviz 是一个开源工具,可以运行在类似于 UNIX® 的大多数平台和 Microsoft® Windows® 之上。适用于大多数平台的二进制文件可以在Graphviz 主页上找到。AIX 二进制文件可以在perzl.org上找到。 Graphviz 应用程序中有多种工具可以生成各种类型...

2019-03-14 00:07:28

阅读数 2403

评论数 0

提示
确定要删除当前文章?
取消 删除