机器学习与人工智能
文章平均质量分 77
孙宝龙
专注全站开发
展开
-
使用manim社区版绘制神经网络结构图
1、概述manim作为非常炫酷的动画系统可以非常清晰生动表述数学原理的相关动画。但是在原生系统中并没有神经网络结构绘制的模块,需要自行开发。本文展示了最基本的dnn网络的绘制方式,供大家参考。2、完整代码class NeuralNetworkMobject(VGroup): # Constructor with parameters of the neurons in a list def __init__(self, neural_network, *arg原创 2021-05-18 13:20:55 · 1018 阅读 · 6 评论 -
使用tensorflow预训练模型进行物体识别(1)
概述物体识别作为计算机视觉领域的一个典型任务,已经有很多成熟的理论与解决方案。本文主要介绍tensorflow的物体识别API的使用。该API提供了了很多预训练模型。可以让我们快速构建自己的物体识别系统。本文将分几个部分充分展示tensorflow object detect API的使用。本文主要展示物体识别的demo,后面的文章将展开说明如何使用该API来训练自己的的数据。1、TensorFlow对象检测API安装1.1 使用git下载代码库当然在安装该API的前提需要安装好CPU...原创 2021-04-13 12:07:27 · 2594 阅读 · 1 评论 -
深度理解期望、方差偏差与方差偏差分解
前言在周志华老师的西瓜书中有关于使用【偏差-方差分解】来度量机器学习模型泛化能力的内容。本文将从数学基础来解释其演进过程。我们先从数学期望开始。1、数学期望概率论是描述现实世界的一个重要学科。我们从现实世界了解数学规律往往是通过一次一次的抽样开始的。我们没做一个事情就会是一次抽样。同样我们也通过做一个事情的经理(也就是多次抽样)来预测,本次做这件事情的成功概率。这本身就是机器学习或者人工智能的过程。所以期望一词也符合我们在场景中的一个定义。当前期望在数学领域并不这样笼统,首先我们需要明确的是原创 2020-12-08 10:50:35 · 3821 阅读 · 1 评论 -
beautiful soup 4.0(bs4)使用css选择器搜索文档树(4)
1、概述上一篇文章中主要介绍了使用bs4搜索文档树,主要使用find与find_all方法。但这种搜索的方法主要专注于标签以及标签的属性。其实在html中可以被用来作为元素选择器的还有一种就是CSS,在css的任何版本中都有选择器的相关定义。在很多框架中我们都是用css的选择器来定位元素的。同样在bs4中,同样提供了一整套基于css的方法来选择元素。2、使用css选择器来搜索文档树在 ...原创 2018-09-12 16:52:39 · 1576 阅读 · 0 评论 -
beautiful soup 4.0(bs4)基本应用(1)
1、概述人工智能行业的发展是以大数据为基础的,在人工智能行业当中,数据比模型本身要重要的多。从一定程度上来讲大量优质的数据可以弥补模型的缺点。而大数据所所涉及的范畴会非常的广泛,有很多在垂直行业深耕很多年的企业会积累很多的行业数据。但这种企业毕竟是少数,很多情况下我们需要自己开发爬虫从互联网上抓取数据,而爬虫程序一个非常重要的环节就是对互联网上的网页进行分析,由于网页上的资料和形式千差万别,能...原创 2018-09-10 13:45:10 · 627 阅读 · 0 评论 -
beautiful soup 4.0(bs4)遍历文档树(2)
1、概述在使用爬虫程序对爬取的文档进行处理时,经常要做的一个操作就是遍历文档树。文档以树形结构进行组织,所以遍历文档的操作又叫遍历文档树。beautiful soup本身提供了很多遍历文档树的方法,本文主要讨论遍历文档树的方法。2、遍历文档树2.1 准备工作本文将使用公众号的文章作为遍历的对象,所以首先需要先把整个文档抓取下来,并将多余的元素去除掉,只保留文档的主体部分以保证文档分...原创 2018-09-10 17:34:00 · 2560 阅读 · 0 评论 -
论文翻译-阿里小蜜,基于检索模型和生成模型相结合的聊天引擎
1、摘要阿里小蜜是一款开放领域的聊天机器人引擎,他结合了IR(检索)模型与带有注意力机制的seq2seq生成模型。从效果上来讲,阿里小蜜的表现明显优于只使用某一种单一模型的情况。2、介绍近年来,聊天机器人技术发展非常迅速,比如微软小冰,苹果的siri,谷歌助手等产品层出不穷。与传统的app的按钮式交互不同,聊天机器人允许用户使用自然语言与app进行交互。阿里小蜜是一款在电商领域的一...原创 2018-10-31 09:49:34 · 1874 阅读 · 0 评论 -
论文翻译-通过对齐与翻译联合学习实现机器翻译
1、摘要基于神经网络的机器学习是目前最为流行的一种机器翻译的方法。与传统的统计学翻译不同,这种翻译方式是通过构建一个神经网络来最大限度提升翻译的性能。该模型是encoder–decoders模型家族中的一种。他使用编码器(encoder)将原始句子编码成一个定长向量,然后使用解码器(decoder)来实现翻译。在本文中,我们推测,在encoder–decoder模型架构下,使用定长向量将是提升...原创 2018-11-01 14:51:31 · 1054 阅读 · 0 评论 -
使用attention机制的seq2seq模型实现论文翻译
1、概述本文是关于attention-seq2seq模型实现中文到英文的翻译。论文的核心gru作为seq2seq模型的基本单元。基本翻译效果如下图所示:2、模型结构整体模型结构如下图所示:相关数学公式如下图所示相关模型说明:FC = 全连接层(dense layer)EO = 编码器(encoder)输出H = 隐藏状态X =解码器(decoder)输入相关公式的模型...原创 2018-12-04 16:21:31 · 1799 阅读 · 2 评论 -
论文翻译-通过无监督方法产生不同风格的唐诗
1、摘要原论文 Stylistic Chinese Poetry Generation via Unsupervised Style Disentanglement链接: http://nlp.csai.tsinghua.edu.cn/~yangcheng/publications/emnlp2018.pdf中国人在写诗歌时主要关注诗歌的意境,在不同的意境下,人们可以创作出不同风格的诗歌。这...原创 2018-11-27 08:32:32 · 1476 阅读 · 0 评论 -
使用对抗生成模型生成手写数字
1、概述对抗生成模型是人工智能模型中经常使用的结构,本文介绍使用tensorflow实现手写数字的生成。生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的...原创 2019-02-20 12:13:51 · 806 阅读 · 0 评论 -
beautiful soup 4.0(bs4)搜索文档树(3)
1、概述在上一篇文章中,主要介绍遍历文档树的方法。遍历文档树主要从文档的根节点开始,对文档进行逐一扫描。这是文档解析中一个非常重要的操作。除了这个操作之外,还有一个非常重要方式就是搜索文档树,搜索文档树并不是从根节点开始逐一的对文档进行操作,而是直接在整个文档中检索到我们需要节点以及内容。比如我们想获取一个文档的标题,可以直接索搜title标签,而不需要从本届点逐个进行遍历操作。2、搜索文...原创 2018-09-12 15:39:20 · 455 阅读 · 0 评论 -
在tensorflow中使用wide&deep模型(1)-模型及应用场景简介
1、概述人工智能的最终目的是为了模拟人的思维状态。而相对于传统的程序而言,人脑的工作机制是非常复杂的。总体来讲人脑的主要功能有一下两个:记忆 推理记忆是对已经见过的物体的总结能力,而推理是将这里记忆数据进行泛化,也就是推广到未知事物的能力。能否使用机器学习模型来模拟这两方面的能力呢。本章节将使用wide&deep模型来实现。如下图所示:在该模型中我们将wide模型由于特...原创 2018-08-21 10:28:17 · 1676 阅读 · 1 评论 -
人工智能如此简单(1)—— 关于权重与偏置
1、人工智能的本质 人工智能是使用程序模拟人类神经感知的技术,他从根本上改变了传统程序的思维。传统程序采用断言的方式来进行,而人工智能则采用抽取规律来实现对应的功能。 这种方式其实是对分析归纳法的一种体现,随着算力与数据量的提升使得人工智能技术变得可能。人工智能涵盖很多领域、如机器学习、深度学习、神经网络等。本文的内容默认都在神经网络的架构下采用tensorflow进...原创 2018-04-29 11:10:04 · 9799 阅读 · 0 评论 -
tensorflow 导入数据(2)
1、概述在前一篇文章中详细讨论了迭代器与数据集的相关内容。由于数据集与迭代器是链接原始数据与程序连接的渠道,所以本文主要讨论如何从原始数据中构建数据集,主要涉及以下场景:内存 TFRecord data 文本文件 csv文件2、从内存中读取数据如果所有的数据都以numpy数据组的形式预先保存到了内存当中,那么我们使用Dataset.from_tensor_slices()方法可...原创 2018-07-28 15:50:43 · 1209 阅读 · 1 评论 -
tensorflow 导入数据(3)
1、概述从文件读取数据时,往往是需要数据转换时,尤其对于多维数据,在使用文件形式进行存储时,除了tfrecord文件格式化,其他的文件的存储都显得无能为力。所以真正从文件读入的数据需要经过转换之后才能够使用。同样在tensorflow这种以小批次进行梯度下降的框架中,需要打乱数据以及对数据进行batch处理,本文主要讨论这些问题。2、使用Dataset.map() 预处理数据Datas...原创 2018-07-30 16:09:49 · 1929 阅读 · 0 评论 -
tensorflow 导入数据(1)
1、概述在tensorflow中的输入数据会有很多形式一般有一下几种形式数据以tf.constant的实行直接嵌入到graph中。在这种情况下一般数据量不会很大,应用场景也比较单一 以tf.placeholder与feed_dic的形式存在 在这种场景下,往往也需要将数据全部读入到内存,转换成tf的张量集合然后再进行处理。在进行大量数据处理时显得的力不从心。以pipel...原创 2018-07-27 18:24:29 · 660 阅读 · 0 评论 -
使用nltk处理中文语料(1)- 统计相关
1、概述nltk作为自然语言处理(nlp)领域里经常被使用的一款工具。本身自带的语料大部分是英文的,其实跟对中文文档,稍作处理之后也是可以使用的,这里主要介绍nlp在中文领域的基础应用。2、nltk安装关于nltk的安装网上有很多的文章介绍,可以使用pip install nltk 命令非常方便的安装nltk。一般在安装完成之后需要使用download命令来下载相关的语料库,这些语料库...原创 2018-08-10 15:45:11 · 18516 阅读 · 8 评论 -
叙事文章的生成(论文翻译)
1、概述本文章是对国外一篇论文【 2002 Elsevier Science B.V.】的翻译,主要介绍了一种叙事文章的生成。一直以来,由于过度关注对故事语法与情节设计,叙事文章的生成的写作质量很差。此外,迄今为止的自然语言生成系统还不能客观地再现自然发生的叙事的多样性或复杂性。本文主要涵盖一下内容。以叙事文章与语言学为基础,提出了一个叙事推断模型。 我们将描述故事的主题结构,以及叙...原创 2018-08-01 10:44:45 · 1030 阅读 · 0 评论 -
自然语言话题分析-从NMF矩阵分解模型说起
1、概述我们在接触自然语言领域都会涉及到基于监督学习与非监督学习的文本分类,在非监督学习领域会提到lsa、lda主题模型的实现。但之前的讨论都是基于工具层面的。其实这些模型的基础算法都是NMF模型分解。可以我们不会对文本从底层去实现这样的算法。但了解其实现的机制还是非常有帮助的。2、关于NMF矩阵NMF的思想:V=WH(W权重矩阵、H特征矩阵、V原矩阵),通过计算从原矩阵提取权重和特征...原创 2018-08-15 16:54:07 · 1864 阅读 · 0 评论 -
深入理解词向量-词向量的可视化
1、概述词向量是自然语言分词在词空间中的表示,词之间的距离代表了分词之间的相似性,我们可以使用gensim,tensorflow等框架非常方便的来实现词向量。但词向量在词空间的分布到底是什么样的,如何更好的理解词向量是一个非常重要的问题。本文将使用tensorbord以及相关的降维技术在三维空间中模拟词向量在高维空间的分布。2、训练词向量词向量的训练是一个无监督的学习过程,这并不是本文...原创 2018-08-16 17:47:49 · 10281 阅读 · 11 评论 -
简单的意图分析模型(1)-数据处理
1、概述在聊天场景中有很多情况下需要对用户的意图进行分析。这些分析功能基本上就是自然语言分类模型的变种。从技术难度上来讲这种模型实现比较简单。但要保证效果主要受一下几个方面的制约。词向量的准确程度 语料的多少 模型的选择词向量是一个多维的坐标,用于在高纬度空间中的距离表示两个词之间的相似度。所以词向量能否准确的表示词与其相关词的关系会直接影响到整个神经网络的推理能力,以及对于新预料的...原创 2018-08-27 16:01:43 · 3740 阅读 · 0 评论 -
简单的意图分析模型(2)-模型构建
1、概述在之前文章中已经对数据做了比较充分的处理,而且已经转化为张量,可以直接读取到tensorflow中进行训练。在本章中将构建神经网络模型来实现意图分析的训练与预测。2、构建神经网络为了更好的构建模型首先对输入数据进行简单分析,目前输入的每一个句子是由8个单词构成,每个单词都是一个300维的向量。而输出结果是一个整数的用于代表他们意图的编号。如下图所示:2.1 构建卷积神经...原创 2018-08-28 11:37:02 · 1472 阅读 · 0 评论 -
第七章:新版tensorflow入门,RNN与LSTM
1、概述传统的神经网络对线性回归、逻辑回归都有比较好的效果。卷积神经网络主要应用与计算机视觉技术。使用过滤器对图片的边缘特征值进行检测。在之前的章节中使用cnn对文本分类其实是借用了计算机视觉的一些原理,过滤器的尺寸也有着特殊的设置。在人工智能领域还有一种应用场景,就是序列模型。之前的算法总体上来讲都是概率分布学的,没有将数据的前后关系包含其中,而在实际的情况下,很多数据都是有时序关系的。比如自然...原创 2018-05-12 10:59:07 · 1258 阅读 · 0 评论