自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

yiyele的博客

Our greatest glory is not in never falling, but in rising every time we fall.

  • 博客(9)
  • 资源 (49)
  • 问答 (1)
  • 收藏
  • 关注

原创 基于LSTM的seq2seq模型介绍以及相应的改进

简介DNN模型在语言识别等任务上具有强大的能力,主要是因为DNN可以在适当步骤中进行并行计算,尽管DNN很灵活并很有用,但是DNN只能用于固定维度的输入以及输出的任务中,并且输入以及输出已知。因此,Ilya sutskever .et提出了基于LSTM模型的端到端的架构。其中用一个LSTM作为encoder,得到一个基于时间序列的向量表示,另外,用另一个LSTM网络作为decoder,从向量中...

2018-06-26 23:34:32 10005

原创 Encoder-Decoder 预训练

Encoder-Decoder模型预训练通过对Encoder-Decoder模型进行预训练能够有效的提高模型的训练效果。

2018-06-26 01:02:30 3940

原创 语言模型简介

1.语言模型简介:统计语言模型是指单词序列的概率分布,假设有一个句子,长度为m,那么整个句子的概率为 p(w1,...,wn)p(w1,...,wn)p(w_1,...,w_n),利用语言模型,可以确定哪个词序列的可能性更大,或者给定若干个词,可以预测下一个最可能出现的词语。假设给定句子:s=w1,w2,..,wks=w1,w2,..,wks=w_1,w_2,..,w_k它的概率可...

2018-06-25 23:14:43 1018

原创 怎样生成一个好的词向量

一.简介本文主要是在我读过论文《How to Generate a Good Word Embedding?》后进行的总结,一下就是我总结的内容。二.综述文中指出几乎所有的词向量训练方法都基于分布式假说:在近似文本中出现的词语倾向于有着近似的意思。因此,目前存在的词向量训练方法在模型结构上分为两个方面,第一是目标词与输入文本之间的关系,第二是输入文本的表示。如下图所示: &nbs...

2018-06-16 13:42:39 4028

原创 RNN-Encoder Decoder架构中引入的注意力机制

一.简介    注意力机制是在Encoder与Deconder架构中针对输出不同的序列(分词)在输入序列中所占权重一样,或者使用同一个C向量的不足中,引入了能够学习针对不同输出序列在不同输入序列所占的比重不同的一个机制,例如,“我喜欢足球”与“i like football”这个翻译中,‘i’这个词的翻译明显与“我”这个输入词对应,与后面“喜欢足球”的关系不大,因...

2018-06-15 22:57:22 5799

原创 LSTM变种-GRU网络结构

简介GRU是LSTM的一种变体,其将忘记门和输入门合成了一个单一的更新门。同样还混合了细胞状态和隐藏状态,加诸其他一些改动。最终的模型比标准的 LSTM 模型要简单,是非常流行的变体。 使用LSTM的原因之一是解决RNN Deep Network的Gradient错误累积太多,以至于Gradient归零或者成为无穷大,所以无法继续进行优化的问题。GRU的构造更简单:比LSTM少一个gate,...

2018-06-12 23:46:34 4499 11

原创 RNN与LSTM网络简述

**最近看到一个blog,对LSTM模型介绍的很全面,所以我在这里记录一下。后续会逐渐补充公式推导的部分。 **RNN关键点之一是连接先前的信息到当前的任务中,而LSTM模型是一种特别的RNN。不幸的是RNN对长期依赖信息的学习能力不足,会出现梯度消失等问题。而LSTM网络就是解决长短时的信息依赖问题。1.简介LSTM网络全称为 Long Short-Term Memory,长期短期记忆...

2018-06-10 20:42:56 5024 1

原创 pandas用法-全网最详细教程

一、生成数据表1、首先导入pandas库,一般都会用到numpy库,所以我们先导入备用:import numpy as np import pandas as pd2、导入CSV或者xlsx文件:df = pd.DataFrame(pd.read_csv(‘name.csv’,header=1)) df = pd.DataFrame(pd.read_excel(‘nam............

2018-06-07 10:49:03 488443 141

转载 conda命令总结

Anaconda常用命令大全使用conda 首先我们将要确认你已经安装好了conda配置环境下一步我们将通过创建几个环境来展示conda的环境管理功能。使你更加轻松的了解关于环境的一切。我们将学习如何确认你在哪个环境中,以及如何做复制一个环境作为备份。测试python然后我们将检查哪一个版本的python可以被安装,以及安装另一个版本的python,还有在两个版本的...

2018-06-05 09:07:44 31337

neural-belief

深度学习网络,个人觉得不错,有需要的朋友可以收藏,自己研究.

2018-09-25

数据库系统概论第5版PPT.rar

数据库经典书籍,最新版。喜欢的可以下载看看。个人觉得还不错。

2017-10-13

推荐系统实践.pdf

推荐系统介绍

2017-08-17

李航.统计学习方法.pdf

统计学习,机器学习的一些算法介绍。

2017-08-17

word2vec_中的数学原理详解.pdf

word2vec原理及数学详解

2017-08-10

PatternRecognitionAndMachineLearning.pdf

机器学习与模式识别

2017-06-02

STL源码剖析简体中文完整版.pdf

STL源码解析

2017-06-02

Learning OpenCV ComputerVision in C++ with the OpenCV Library.pdf

opencv C++ 机器视觉

2017-06-02

Linux命令行大全.pdf

linux命令行大全

2017-06-02

VTK教程-东灵工作室.docx

VTK基本教程书籍

2017-06-02

Google-C++编码规范中文版.pdf

google C++ 编码规范

2017-06-02

shell编程基础.pdf

shell编程基础书籍

2017-06-02

Linux 运维入门到高级.pdf

linux基本教程

2017-06-02

微软等数据结构+算法面试100题全部答案集锦.pdf

微软算法题,值得一看。

2017-06-02

pywin32 for py2.7 - 32&64.zip

pywin32.32位和64位。

2017-06-02

十五个经典算法研究与总结、目录+索引

经典算法总结文档

2017-05-18

神经网络设计.pdf

神经网络书籍,值得一看。

2017-05-17

深入Linux内核架构.pdf

linux书籍深入解读。

2017-04-23

数值分析.pdf

数值分析

2017-04-23

20个软件开发常用设计文档大全下载.rar

软件开发设计文档模板

2017-04-23

计算机网络原理.pdf

计算机网络基础书籍,不错,值得一看。

2017-04-18

有限元方法编程(第三版).pdf

有限元的编程技术

2017-04-07

直方图均衡化.pdf

直方图均衡化

2017-04-07

Hadoop技术内幕 深入解析HADOOP.pdf

hadoop相关书籍。

2017-04-07

支持向量机导论(中文).pdf

支持向量机导论,不错。

2017-04-07

MySQL_5.5中文参考手册.pdf

mysql数据库的参考手册,中文版。

2017-04-07

multi-objective machine learning.pdf

多目标机器学习,非常值得一看。

2017-03-23

dcmtk-3.6.0.zip

dcmtk-3.6.0.zip

2017-02-26

redis-2.6.zip

redis-2.6.zip

2017-02-26

WinPcap4.1.3

包含Packet.dll WinPCap.dll 以及lib ,还有winpcap的413的安装程序。还有ws2_32.lib

2017-02-25

机器学习实战pdf

python实现了机器学习相关的算法,非常实用。

2017-02-23

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除