amao1998的博客

专注iT开发

自定义博客皮肤

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

使用对抗生成模型生成手写数字

1、概述 对抗生成模型是人工智能模型中经常使用的结构,本文介绍使用tensorflow实现手写数字的生成。生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块...

2019-02-20 12:13:51

阅读数 90

评论数 0

使用attention机制的seq2seq模型实现论文翻译

1、概述 本文是关于attention-seq2seq模型实现中文到英文的翻译。论文的核心gru作为seq2seq模型的基本单元。基本翻译效果如下图所示: 2、模型结构 整体模型结构如下图所示: 相关数学公式如下图所示 相关模型说明: FC = 全连接层(dense layer) EO =...

2018-12-04 16:21:31

阅读数 279

评论数 2

论文翻译-通过无监督方法产生不同风格的唐诗

1、摘要 原论文 Stylistic Chinese Poetry Generation via Unsupervised Style Disentanglement 链接: http://nlp.csai.tsinghua.edu.cn/~yangcheng/publications/emnlp...

2018-11-27 08:32:32

阅读数 293

评论数 0

论文翻译-通过对齐与翻译联合学习实现机器翻译

1、摘要 基于神经网络的机器学习是目前最为流行的一种机器翻译的方法。与传统的统计学翻译不同,这种翻译方式是通过构建一个神经网络来最大限度提升翻译的性能。该模型是encoder–decoders模型家族中的一种。他使用编码器(encoder)将原始句子编码成一个定长向量,然后使用解码器(decod...

2018-11-01 14:51:31

阅读数 305

评论数 0

论文翻译-阿里小蜜,基于检索模型和生成模型相结合的聊天引擎

1、摘要 阿里小蜜是一款开放领域的聊天机器人引擎,他结合了IR(检索)模型与带有注意力机制的seq2seq生成模型。从效果上来讲,阿里小蜜的表现明显优于只使用某一种单一模型的情况。 2、介绍 近年来,聊天机器人技术发展非常迅速,比如微软小冰,苹果的siri,谷歌助手等产品层出不穷。与传统的a...

2018-10-31 09:49:34

阅读数 561

评论数 0

成语接龙改版

1、概述 上一版的成语接龙中,对汉字进行了严格匹配,我们会发现,在这种情况下,成语接龙的长度很短。如下图所示: 原因是什么呢,因为我们一般在玩成语接龙游戏时遵循的原则是可以音同字不同。给予这种需求,我们对之前的代码进行一次改版 2、代码实现 这里我们使用了xpinyin库,这个库的主要...

2018-10-20 15:41:50

阅读数 444

评论数 1

python成语接龙

1、概述 在python开发中要熟练字符串、列表、元组、字典等多种数据类型的使用,本文通过实现简单的成语接龙,来巩固python中的基础功能。 2、处理语料 我们可以从互联网上下载成语大全等语料,建议建议对语料进行处理和清洗之后读取到列表(list)中。请参考下面代码: # 读取数据 f...

2018-10-18 15:29:32

阅读数 956

评论数 0

python开发环境搭建

1、概述 python是目前人工智能开发使用最为广泛的语言,随着深度学习、神经网络以及tensorflow等人工智能框架的发展。python的应用也变得越来越广泛。下面截图是tiobe 2018年10月编程语言的排行榜。 同样在人工智能编程领域python的表现也是非常优秀的。python...

2018-10-17 15:17:21

阅读数 59

评论数 0

beautiful soup 4.0(bs4)使用css选择器搜索文档树(4)

1、概述 上一篇文章中主要介绍了使用bs4搜索文档树,主要使用find与find_all方法。但这种搜索的方法主要专注于标签以及标签的属性。其实在html中可以被用来作为元素选择器的还有一种就是CSS,在css的任何版本中都有选择器的相关定义。在很多框架中我们都是用css的选择器来定位元素的。同...

2018-09-12 16:52:39

阅读数 473

评论数 0

beautiful soup 4.0(bs4)搜索文档树(3)

1、概述 在上一篇文章中,主要介绍遍历文档树的方法。遍历文档树主要从文档的根节点开始,对文档进行逐一扫描。这是文档解析中一个非常重要的操作。除了这个操作之外,还有一个非常重要方式就是搜索文档树,搜索文档树并不是从根节点开始逐一的对文档进行操作,而是直接在整个文档中检索到我们需要节点以及内容。比如...

2018-09-12 15:39:20

阅读数 119

评论数 0

beautiful soup 4.0(bs4)遍历文档树(2)

1、概述 在使用爬虫程序对爬取的文档进行处理时,经常要做的一个操作就是遍历文档树。文档以树形结构进行组织,所以遍历文档的操作又叫遍历文档树。beautiful soup本身提供了很多遍历文档树的方法,本文主要讨论遍历文档树的方法。 2、遍历文档树 2.1 准备工作 本文将使用公众号的文章作...

2018-09-10 17:34:00

阅读数 800

评论数 0

beautiful soup 4.0(bs4)基本应用(1)

1、概述 人工智能行业的发展是以大数据为基础的,在人工智能行业当中,数据比模型本身要重要的多。从一定程度上来讲大量优质的数据可以弥补模型的缺点。而大数据所所涉及的范畴会非常的广泛,有很多在垂直行业深耕很多年的企业会积累很多的行业数据。但这种企业毕竟是少数,很多情况下我们需要自己开发爬虫从互联网上...

2018-09-10 13:45:10

阅读数 231

评论数 0

简单的意图分析模型(2)-模型构建

1、概述 在之前文章中已经对数据做了比较充分的处理,而且已经转化为张量,可以直接读取到tensorflow中进行训练。在本章中将构建神经网络模型来实现意图分析的训练与预测。 2、构建神经网络 为了更好的构建模型首先对输入数据进行简单分析,目前输入的每一个句子是由8个单词构成,每个单词都是一个...

2018-08-28 11:37:02

阅读数 293

评论数 0

简单的意图分析模型(1)-数据处理

1、概述 在聊天场景中有很多情况下需要对用户的意图进行分析。这些分析功能基本上就是自然语言分类模型的变种。从技术难度上来讲这种模型实现比较简单。但要保证效果主要受一下几个方面的制约。 词向量的准确程度 语料的多少 模型的选择 词向量是一个多维的坐标,用于在高纬度空间中的距离表示两个词之间的...

2018-08-27 16:01:43

阅读数 553

评论数 0

在tensorflow中使用wide&deep模型(1)-模型及应用场景简介

1、概述 人工智能的最终目的是为了模拟人的思维状态。而相对于传统的程序而言,人脑的工作机制是非常复杂的。总体来讲人脑的主要功能有一下两个: 记忆 推理 记忆是对已经见过的物体的总结能力,而推理是将这里记忆数据进行泛化,也就是推广到未知事物的能力。能否使用机器学习模型来模拟这两方面的能力呢。本...

2018-08-21 10:28:17

阅读数 625

评论数 1

深入理解词向量-词向量的可视化

1、概述 词向量是自然语言分词在词空间中的表示,词之间的距离代表了分词之间的相似性,我们可以使用gensim,tensorflow等框架非常方便的来实现词向量。但词向量在词空间的分布到底是什么样的,如何更好的理解词向量是一个非常重要的问题。本文将使用tensorbord以及相关的降维技术在三维空...

2018-08-16 17:47:49

阅读数 3709

评论数 7

自然语言话题分析-从NMF矩阵分解模型说起

1、概述 我们在接触自然语言领域都会涉及到基于监督学习与非监督学习的文本分类,在非监督学习领域会提到lsa、lda主题模型的实现。但之前的讨论都是基于工具层面的。其实这些模型的基础算法都是NMF模型分解。可以我们不会对文本从底层去实现这样的算法。但了解其实现的机制还是非常有帮助的。 2、关于N...

2018-08-15 16:54:07

阅读数 324

评论数 0

使用nltk处理中文语料(1)- 统计相关

1、概述 nltk作为自然语言处理(nlp)领域里经常被使用的一款工具。本身自带的语料大部分是英文的,其实跟对中文文档,稍作处理之后也是可以使用的,这里主要介绍nlp在中文领域的基础应用。 2、nltk安装 关于nltk的安装网上有很多的文章介绍,可以使用pip install nltk 命...

2018-08-10 15:45:11

阅读数 4472

评论数 0

叙事文章的生成(论文翻译)

1、概述 本文章是对国外一篇论文【 2002 Elsevier Science B.V.】的翻译,主要介绍了一种叙事文章的生成。 一直以来,由于过度关注对故事语法与情节设计,叙事文章的生成的写作质量很差。此外,迄今为止的自然语言生成系统还不能客观地再现自然发生的叙事的多样性或复杂性。本文主要涵...

2018-08-01 10:44:45

阅读数 161

评论数 0

tensorflow 导入数据(3)

1、概述 从文件读取数据时,往往是需要数据转换时,尤其对于多维数据,在使用文件形式进行存储时,除了tfrecord文件格式化,其他的文件的存储都显得无能为力。所以真正从文件读入的数据需要经过转换之后才能够使用。同样在tensorflow这种以小批次进行梯度下降的框架中,需要打乱数据以及对数据进行...

2018-07-30 16:09:49

阅读数 751

评论数 0

提示
确定要删除当前文章?
取消 删除