自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

yiyele的博客

make hard to easy!!

  • 博客(114)
  • 资源 (54)
  • 论坛 (7)
  • 问答 (1)
  • 收藏
  • 关注

原创 对话机器人综述

综述从应用的角度来说,对话机器人可以分为三个类别,分别是闲聊机器人,qa机器人以及任务型机器人。本系列主要介绍闲聊机器人。由于本文的内容主要是对对话机器人做一个简单的介绍,所以都是一些简单的介绍,详细的内容后面后有介绍。一 QA机器人问答机器人主要功能是在知识库找到用户提问的问题的答案。主要用于智能客服等。一般来说问答机器人是不涉及多轮,主要是针对某一个领域的问答。构建一个问答...

2019-12-17 22:47:54 9384

原创 设计模式之小结

设计模式系统总结: 1.设计模式-创建型软件设计模式(一) 2.设计模式-创建型软件设计模式(二) 3.设计模式-创建型软件设计模式(三) 4.设计模式-结构型软件设计模式(一) 5.设计模式-结构型软件设计模式(二) 6.设计模式-结构型软件设计模式(三) 7.设计模式-结构型软件设计模式(四) 8.设计模式-行为型软件设计模式(一) 9. 设计模式-行为型软件设计模式(二)

2017-07-16 12:00:56 8803 2

原创 算法与数据结构系列

本篇是算法与数据结构系列的目录: 1.排序算法总结 2.红黑树 3.在线生成红黑树作者:yiyele 转载请保留原文地址:http://write.blog.csdn.net/mdeditor#!postId=74317447如果本文对您有所帮助,欢迎您扫码下图所示的微信支付点赞码对本文进行打赏。

2017-07-04 14:10:24 8381

原创 C++系列之浅谈

本篇blog是关于所有C++文章的所有链接总结: 1.从C++类创建后,自动创建的函数有哪些开始谈起 2.this指针介绍 3.C++模板详解 4.C++关键字总结 5. C++内存处理 6. 内存映射文件原理探索 7.C++中使用内存映射文件存取struct,并用指针访问 8.C++实现只能动态或者静态创建对象 9.静态链接库和动态链接库 1

2017-06-29 18:21:51 10316

原创 关于机器学习-深度学习的总结

最近在知乎上看到了一个机器学习的相关学习流程,觉得很有道理,所以,后面的blog我将开始具体的分享一些机器学习的学习笔记。目前已经更新的blog有:数据篇:1.关于中英文语料的获取途径总结基础总结篇:1.机器学习中的相似性度量2.机器学习中的损失函数总结3.pearson相关系数与spearman相关系数4.机器学习中error(误差),bias(偏差)与varienc...

2017-02-28 13:41:28 12141 1

原创 终端快捷键操作

Terminator操作快捷命令具体的命令操作如下:作用命令打开terminatorCtrl+Alt+T新建终端窗口Ctrl+Shift+T关闭终端窗口Ctrl+D清空屏幕Ctrl+L自动补全Tab光标移动到行首Ctrl+a光标移动到行末Ctrl+e向前移动光标Ctrl+f向后移动光标Ctrl+b删除当前字符Ctrl+d删除前一个字符Ctrl+h删除光标至行首所有字符Ctrl+u删除光标至

2020-11-10 19:54:49 210 1

原创 nlp相关会议总结

相关nlp会议的总结A类:ACL(ACL) Meeting of the Association for Computational Linguistics 下载地址:https://link.zhihu.com/?target=http%3A//www.aclweb.org/anthology-new/IJCAI(AAAI) International Joint Conference on Artificial Intelligence 国际人工智能联合会议两年一次,奇数年份举办 IJ

2020-06-23 20:33:07 8456

原创 线性规划-概念与公式总结

linear algebra用空间的语言表达向量、矩阵和行列式向量与空间基底线性空间是一个只有原点的空间,没有坐标,没有刻度。所以在线性空间中只能做向量的加法与数乘(数字与向量相乘)运算。但是为了能够更好的描述有向线段,所以需要基底。所以作为基准的一组向量作为基底,这一组向量中的的每个向量称为基向量。基底的选取条件:当前空间中的任何向量v→\overrightarrow{v}v都可以表示为:v→=xie→1+...+xne→n\overrightarrow{v}=x_i\overrigh

2020-06-23 20:29:19 8879

原创 Docker使用教程之命令大全

Docker 使用教程主要命令搜索需要的imagedocker search XXX拉取镜像:docker image pull XXX运行docker:docker run --gpus all -itd --name xxq_tf2 -v /home/work/xx/data:/root/data -v /home/work/xx/algpt2:/root/algpt2 -v /home/work/xx/algpt2:/root/xx patientzero/tensorf

2020-05-22 19:43:00 6134

原创 chatbot-检索式模型介绍(四)

检索式模型介绍(四)这个系列的文章主要是介绍一些可以作为文本匹配工作的一些模型,有些是比较基础的算法,例如bm25。有些模型是基于深度学习的架构,比如说deepMatch模型。个人认为文本匹配的任务有两种实现方式,一个是学习不同domain中text的represation,然后利用represation计算score,这个的score可以是相似度(cosine,欧式距离等)。...

2020-04-19 15:46:53 9548

原创 Chatbot-检索式模型介绍(三)

检索式模型介绍(三)这个系列的文章主要是介绍一些可以作为文本匹配工作的一些模型,有些是比较基础的算法,例如bm25。有些模型是基于深度学习的架构,比如说deepMatch模型。个人认为文本匹配的任务有两种实现方式,一个是学习不同domain中text的represation,然后利用represation计算score,这个的score可以是相似度(cosine,欧式距离等)。...

2020-01-19 16:28:23 11292

原创 Chatbot-检索式模型介绍(二)

检索式模型介绍(二)这个系列的文章主要是介绍一些可以作为文本匹配工作的一些模型,有些是比较基础的算法,例如bm25。有些模型是基于深度学习的架构,比如说deepMatch模型。个人认为文本匹配的任务有两种实现方式,一个是学习不同domain中text的represation,然后利用represation计算score,这个的score可以是相似度(cosine,欧式距离等)。...

2020-01-15 20:46:29 11866

原创 Chatbot-检索式模型介绍(一)

检索式模型介绍(一)这个系列的文章主要是介绍一些可以作为文本匹配工作的一些模型,有些是比较基础的算法,例如bm25。有些模型是基于深度学习的架构,比如说deepMatch模型。个人认为文本匹配的任务有两种实现方式,一个是学习不同domain中text的represation,然后利用represation计算score,这个的score可以是相似度(cosine,欧式距离等)。...

2020-01-08 20:34:48 9364

原创 tensorflow serving服务器安装过程总结

1.安装环境centoscuda 9cudnn 72.非gpu版本tf_serving安装tf_serving的安装(非gpu版本)(cuda 9 cudnn 7)编译tf_serving的过程git clone -b r1.3 --recurse-submodules https://github.com/tensorflow/serving进入serving/tensor...

2019-05-06 14:54:13 1326 4

原创 bert模型代码介绍

关于bert模型的细节记录1. Input1.1. pretrain输入包含七个部分,分别为input_ids,input_mask,segment_ids,masked_lm_positions,mask_lm_ids,masked_lm_weights,next_sentence_labels.input_ids:表示tokens的idsinput_mask:表示哪些是inpu...

2019-05-06 14:46:28 9258 7

原创 tensorflow- tf.reduce_all

函数 tf.reduce_all示例

2019-04-09 20:01:34 1321

原创 tensoflow-unstack

函数unstack示例

2019-04-09 19:59:29 483

原创 tensorflow-tile_batch

函数tensorflow.contrib.seq2seq.tile_batch作用主要是对tensor复制importtensorflow.contrib.seq2seq as seq2seq示例

2019-04-09 19:49:56 440

原创 论文总结:Ask Me Anything: Dynamic Memory Networks for Natural Language Processing

论文总结:Ask Me Anything: Dynamic Memory Networks for Natural Language Processing简介具体结构Input ModuleQuestion ModuleEpisodic Memory ModuleAnswer Module简介本文主要是对《Ask Me Anything: Dynamic Memory Networks for...

2018-09-30 14:32:58 642

原创 如何将pyspark的rdd数据类型转化为DataFrame

简述  在用pyspark进行开发的时候,经常会遇到如何将pyspark读取的数据使用xgboost的模型进行训练,当然,如果是使用scala,可以直接使用xgboost4j,这个库里面提供了可以读取rdd的数据文件的函数接口,通过scala可以很简单的进行训练,但是对于python用户来说,如何使用pyspark和xgboost进行训练,就比较难以处理了?   本人通过对libsvm的数据...

2018-09-17 11:03:33 4592

原创 关于中英文语料的获取途径总结

中文:https://github.com/candlewill/Dialog_Corpus 这个是一个集合,包括之前答主的答案! 包含的语料包括了 1)小黄鸡 xiaohuangji50w_nofenci.conv.zip 2)dgk_shooter_min.conv.zip 中文电影对白语料,噪音比较大,许多对白问答关系没有对应好 3)smsCorpus_zh_xml_201...

2018-09-01 11:51:26 6963 1

原创 关于RNN相关模型-tensorflow源码理解

本文主要是对tensorflow中lstm模型中的c,h进行解析。rnn_cell_impl.py1.关于RNN模型在rnn_cell_impl.py的tensorflow源码中,关于RNN部分实现的类主要是BasicRNNCell, 首先在build函数中,定义了两个变量_kernel和_bias。 其中_num_untis表示RNN cell 的unt...

2018-08-23 21:03:32 6124

原创 关于transformer模型总结(源码)

本文主要是对transfermer模型的源码进行解析: transfermer主要结构是由encoder和decoder构成。其中,encoder是由embedding + positional_encoding作为输入,然后加一个dropout层,然后输入放到6个multihead_attention构成的结构中,每个multihead_attention后面跟一个feedforwar...

2018-08-21 19:19:41 9044 1

原创 grid lstm模型简介

理论介绍主要通过论文《Grid Long short-Term Memory》。 grid LSTM沿着任何或所有维度(包括网络深度)部署cell。 一个Grid LSTM网络的block有N个hidden vector h1, …, hN和N 个memory vectorm1,m2..作为输入,另外block的各个输出各不相同。 标准的lstm模型的计算公式如下: 源码介绍...

2018-08-21 18:26:39 2586 2

原创 Normalization Technique总结

1.相关介绍:神经网络在多个领域取得了非凡的成就,例如,语音识别,图像识别等。所以,训练神经网络是个重要的任务,gradient descent常被用来寻来拿神经网络。但在网络比较深时,gradient descent容易出现梯度消失或梯度爆炸等现象。因此,在使用SGD算法对神经网络进行优化时,需要小心的对模型超参数进行微调,例如学习速率,模型参数的初始化等。神经网络的训练过程是很复杂的,每层...

2018-08-06 20:33:20 8523

原创 SRU介绍

1.背景介绍    RNN模型在机器翻译,语言模型,问答系统中取得了非凡的成就,由于RNN的结构,当前的层输入为前一层的输出,所有RNN比较适合时间序列问题,但也正是由于这种串行结构,限制了RNN模型的训练速度,与CNN相比,RNN并不能进行并行化处理。而SRU网络结构的提出就是为了解决这个问题,SRU(simple recurrent units)将大...

2018-08-03 19:52:14 7778

原创 tensorflow中关于BahdanauAttention以及LuongAttention实现细节

背景介绍在 TensorFlow 中,Attention 的相关实现代码是在 tensorflow/contrib/seq2seq/python/ops/attention_wrapper.py 文件中,这里面实现了两种 Attention 机制,分别是 BahdanauAttention 和 LuongAttention,其实现论文分别如下: Neural Machine Translat...

2018-08-03 19:38:54 6624

原创 LSTM模型的两种分解技巧

介绍LSTM模型在语言模型,机器翻译等领域取得了非凡的成就,然后LSTM网络有几百万的参数以及需要数周在多GPU系统中进行训练。因此,一下介绍两种方法来缩减网络参数以及训练时间。两种方法分别为factorized LSTM(FLSTM)以及group LSTM(GLSTM)。FLSTMFLSTM网络主要是将大的LSTM矩阵转化为两个小的矩阵。LSTM模型简单介绍在LST...

2018-07-21 11:13:22 2934

原创 高效的文本分类

相关介绍文本分类任务是自然语言处理中重要的任务之一,近来,神经网络的使用变得更为普遍,神经网络在文本分类任务中表现更好,但是在训练和测试时间比较慢,限制了在大型语料库中的使用。 与此同时,线性分类器在文本分类器中被认为是一种很好的baseline,尽管他们很简单,但当正确的特征被使用时,经常能够得到很好的表现[wang and Manning,2012]。线性模型也适用于非常大的语料库。因此...

2018-07-11 21:18:00 925

原创 基于LSTM的seq2seq模型介绍以及相应的改进

简介DNN模型在语言识别等任务上具有强大的能力,主要是因为DNN可以在适当步骤中进行并行计算,尽管DNN很灵活并很有用,但是DNN只能用于固定维度的输入以及输出的任务中,并且输入以及输出已知。因此,Ilya sutskever .et提出了基于LSTM模型的端到端的架构。其中用一个LSTM作为encoder,得到一个基于时间序列的向量表示,另外,用另一个LSTM网络作为decoder,从向量中...

2018-06-26 23:34:32 5481

原创 Encoder-Decoder 预训练

Encoder-Decoder模型预训练通过对Encoder-Decoder模型进行预训练能够有效的提高模型的训练效果。

2018-06-26 01:02:30 2211

原创 语言模型简介

1.语言模型简介:统计语言模型是指单词序列的概率分布,假设有一个句子,长度为m,那么整个句子的概率为 p(w1,...,wn)p(w1,...,wn)p(w_1,...,w_n),利用语言模型,可以确定哪个词序列的可能性更大,或者给定若干个词,可以预测下一个最可能出现的词语。假设给定句子:s=w1,w2,..,wks=w1,w2,..,wks=w_1,w_2,..,w_k它的概率可...

2018-06-25 23:14:43 406

原创 怎样生成一个好的词向量

一.简介本文主要是在我读过论文《How to Generate a Good Word Embedding?》后进行的总结,一下就是我总结的内容。二.综述文中指出几乎所有的词向量训练方法都基于分布式假说:在近似文本中出现的词语倾向于有着近似的意思。因此,目前存在的词向量训练方法在模型结构上分为两个方面,第一是目标词与输入文本之间的关系,第二是输入文本的表示。如下图所示: &nbs...

2018-06-16 13:42:39 2762

原创 RNN-Encoder Decoder架构中引入的注意力机制

一.简介    注意力机制是在Encoder与Deconder架构中针对输出不同的序列(分词)在输入序列中所占权重一样,或者使用同一个C向量的不足中,引入了能够学习针对不同输出序列在不同输入序列所占的比重不同的一个机制,例如,“我喜欢足球”与“i like football”这个翻译中,‘i’这个词的翻译明显与“我”这个输入词对应,与后面“喜欢足球”的关系不大,因...

2018-06-15 22:57:22 4394

原创 LSTM变种-GRU网络结构

简介GRU是LSTM的一种变体,其将忘记门和输入门合成了一个单一的更新门。同样还混合了细胞状态和隐藏状态,加诸其他一些改动。最终的模型比标准的 LSTM 模型要简单,是非常流行的变体。 使用LSTM的原因之一是解决RNN Deep Network的Gradient错误累积太多,以至于Gradient归零或者成为无穷大,所以无法继续进行优化的问题。GRU的构造更简单:比LSTM少一个gate,...

2018-06-12 23:46:34 2464

原创 RNN与LSTM网络简述

**最近看到一个blog,对LSTM模型介绍的很全面,所以我在这里记录一下。后续会逐渐补充公式推导的部分。 **RNN关键点之一是连接先前的信息到当前的任务中,而LSTM模型是一种特别的RNN。不幸的是RNN对长期依赖信息的学习能力不足,会出现梯度消失等问题。而LSTM网络就是解决长短时的信息依赖问题。1.简介LSTM网络全称为 Long Short-Term Memory,长期短期记忆...

2018-06-10 20:42:56 3754 1

原创 pandas用法总结

一、生成数据表1、首先导入pandas库,一般都会用到numpy库,所以我们先导入备用:import numpy as np import pandas as pd2、导入CSV或者xlsx文件:df = pd.DataFrame(pd.read_csv(‘name.csv’,header=1)) df = pd.DataFrame(pd.read_excel(‘nam...

2018-06-07 10:49:03 137965 24

转载 conda命令总结

Anaconda常用命令大全使用conda 首先我们将要确认你已经安装好了conda配置环境下一步我们将通过创建几个环境来展示conda的环境管理功能。使你更加轻松的了解关于环境的一切。我们将学习如何确认你在哪个环境中,以及如何做复制一个环境作为备份。测试python然后我们将检查哪一个版本的python可以被安装,以及安装另一个版本的python,还有在两个版本的...

2018-06-05 09:07:44 6733

原创 我的读研经历与算法岗求职经验

其实一直觉得自己求职经历与校招去的公司相对于很多大神来说,并不算什么,所以也一直没有想法写关于自己的读研以及求职经验。不过,最近经一个朋友的提醒,我想虽然自己的求职经历并不算很牛逼,但总会给一些准备找工作或者准备校招的人一些帮助。基本说明由于面试已经过去不少时间了,很多面试的细节已经不记得了,所以对于面试的部分我会简单的说明一下,并不会具体的介绍面试的问题。本人校招工作是算法岗,但...

2018-05-08 22:23:31 12029 12

原创 简单的神经元模型

简单的神经元模型线性神经元其函数表达如下所示: y=b+∑ixiwiy=b+∑ixiwiy=b+\sum_ix_iw_i 其中,www表示权值,xxx表示输入。yyy表示输出。 线性神经元模型中,输入xi可以被看作是 来自其他神经元的动作电位,该动作电位引起突触的兴奋。权重 wi 可以认为是对突触的影响系数。wi 的值越大,输入xi对神经元输出的影响程度就越大。在一个真正的神经元中,...

2018-04-09 20:30:38 4086

程序员自我修养.pdf

关于程序员的不错的书籍。

2017-06-02

neural-belief

深度学习网络,个人觉得不错,有需要的朋友可以收藏,自己研究.

2018-09-25

数据库系统概论第5版PPT.rar

数据库经典书籍,最新版。喜欢的可以下载看看。个人觉得还不错。

2017-10-13

同济大学《线性代数》(第五版)

线性代数 pdf 同济大学出版

2017-08-29

深度学习Deep Learning 中文版

深度学习书籍,中文版

2017-08-29

推荐系统实践.pdf

推荐系统介绍

2017-08-17

李航.统计学习方法.pdf

统计学习,机器学习的一些算法介绍。

2017-08-17

剑指offer.pdf

求职必备工具书

2017-08-10

word2vec_中的数学原理详解.pdf

word2vec原理及数学详解

2017-08-10

自然语言处理(中文).pdf

python,进行自然语言处理

2017-08-08

PatternRecognitionAndMachineLearning.pdf

机器学习与模式识别

2017-06-02

STL源码剖析简体中文完整版.pdf

STL源码解析

2017-06-02

Learning OpenCV ComputerVision in C++ with the OpenCV Library.pdf

opencv C++ 机器视觉

2017-06-02

Linux命令行大全.pdf

linux命令行大全

2017-06-02

VTK用户手册.pdf

VTK基础书籍,初学者适用。

2017-06-02

VTK教程-东灵工作室.docx

VTK基本教程书籍

2017-06-02

淘宝技术这十年,完整最终确认版.pdf

淘宝技术介绍

2017-06-02

Google-C++编码规范中文版.pdf

google C++ 编码规范

2017-06-02

IBM Watson大数据与分析平台技术概述.pdf

IBM大数据平台技术概述

2017-06-02

shell编程基础.pdf

shell编程基础书籍

2017-06-02

[Python标准库示例].(The.Python.Standard.Library.by.Example).Doug.Hellmann.文字版.pdf

python标准库实例

2017-06-02

Python核心编程(中文第二版)带目录.pdf

python核心编程书籍,第二版。

2017-06-02

c++标准程序库.pdf

C++ 标准库

2017-06-02

Linux 运维入门到高级.pdf

linux基本教程

2017-06-02

微软等数据结构+算法面试100题全部答案集锦.pdf

微软算法题,值得一看。

2017-06-02

pywin32 for py2.7 - 32&64.zip

pywin32.32位和64位。

2017-06-02

十五个经典算法研究与总结、目录+索引

经典算法总结文档

2017-05-18

神经网络设计.pdf

神经网络书籍,值得一看。

2017-05-17

tensorflow_manual_cn.pdf

深度学习 tensorflow 值得一看

2017-05-09

Effective C++中文第三版.pdf

C++ 必看书籍之一

2017-04-23

深入Linux内核架构.pdf

linux书籍深入解读。

2017-04-23

人月神话.pdf

程序员值得一看的书籍,不错。

2017-04-23

数值分析.pdf

数值分析

2017-04-23

20个软件开发常用设计文档大全下载.rar

软件开发设计文档模板

2017-04-23

计算机网络原理.pdf

计算机网络基础书籍,不错,值得一看。

2017-04-18

级联分类器_人脸检测_OpenCV官方教程.pdf

opencv 人脸识别

2017-04-07

有限元方法编程(第三版).pdf

有限元的编程技术

2017-04-07

直方图均衡化.pdf

直方图均衡化

2017-04-07

计算机视觉—算法与应用.pdf

计算机视觉。

2017-04-07

Hadoop技术内幕 深入解析HADOOP.pdf

hadoop相关书籍。

2017-04-07

一夜了的留言板

发表于 2020-01-02 最后回复 2020-01-02

debug版本和release版本有什么区别??

发表于 2016-07-28 最后回复 2018-07-13

博文异常以及丢失

发表于 2017-10-10 最后回复 2017-10-10

调用一个类库,主要作用是写三维模型,但是当模型过大时,就出现内存错误

发表于 2016-07-28 最后回复 2017-02-26

有关Qt QAxWidget读取word 的问题

发表于 2016-03-02 最后回复 2016-11-08

怎么用VTK读取DICOM格式的图像,需要给出代码,多谢!!

发表于 2015-11-13 最后回复 2016-03-02

怎样用java程序打开酷狗播放器啊?

发表于 2012-07-15 最后回复 2015-11-13

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除