孙宝龙-CSDN博客

原创让您的照片动起来first motion model（4）-对抗生成网络与模型训练

1、概述本章将介绍模型剩余的部分与数据加载与训练2、GeneratorFullModel完整的生成器2.1 金字塔网络（ImagePyramide）该网络用于获取不同缩放比的照片class ImagePyramide(torch.nn.Module): """ Create image pyramide for computing pyramide perceptual loss. See Sec 3.3 """ def __init__(self, s

2021-05-24 09:12:48 1740 14

原创让您的照片动起来first motion model（3）-遮罩生成模型（OcclusionAwareGenerator）深度解析

1、概述在上一篇文章中详细分析了DENSE MOTION模型。该模型将输出图像动画的密集变换反向光流场。本章将解析生成图像的关键部分遮罩生成模型（OcclusionAwareGenerator）模型结构如下2、关键组件分析2.1 SameBlock2d维持原分辨率进行单次下采样init:初始化self.first = SameBlock2d(num_channels, block_expansion, kernel_size=(7, 7), padding=(3, 3))..

2021-05-22 10:42:51 1688 3

原创让您的照片动起来first motion model（2）-DENSE MOTION模型深度解析

1 概述如果还没有阅读第一篇文章，建议先阅读。再阅读本章内容《让您的照片动起来first motion model（1）-关键点抽取模型深度解析》在第一篇文章中详细介绍了关键点抽取模型的技术关键点以及其雅各比矩阵。相关的数学理论是taylor级数的一阶展开式。关于数学理论部分会单独写文章为大家剖析。在关键点抽取出来之后，我们需要使用关键点位移以及其周边像素的仿射变换，来构建其密集变换模型（dense motion network）。2、Dense Motion Network2.1k..

2021-05-21 09:01:28 2542 7

原创使用manim社区版绘制神经网络结构图

1、概述manim作为非常炫酷的动画系统可以非常清晰生动表述数学原理的相关动画。但是在原生系统中并没有神经网络结构绘制的模块，需要自行开发。本文展示了最基本的dnn网络的绘制方式，供大家参考。2、完整代码class NeuralNetworkMobject(VGroup): # Constructor with parameters of the neurons in a list def __init__(self, neural_network, *arg

2021-05-18 13:20:55 1301 6

原创让数学变得更生动manim库的使用（5）-图graph

1、概述在数学系统中图是一个完整的学科，也包含图论这样经典的理论研究。使用动画系统演示图的相关操作，可以让抽象的问题具体化，抽象的问题简单化。2、构建图%%manim -ql -v WARNING -i MovingVerticesclass MovingVertices(Scene): def construct(self): vertices = [1, 2, 3, 4] edges = [(1, 2), (2, 3), (3, 4), (1

2021-05-06 22:40:58 916

原创让数学变得更生动manim库的使用（4）-动画系统详解

1、概述在第二篇文章中已经对动画系统做了简要的说明，本文将用更多示例详细说明manim中的各种动画。需要说明的是，以前三篇文章使用的是manimCE0.50的版本。而本文升级到了0.60所以很多示例可能在0.50的版本中无法正常运行。2、淡入淡出%%manim -ql -v WARNING -i FadeSceneclass FadeScene(Scene): def construct(self): text = Text('First Order Model.

2021-05-06 22:31:05 2157

原创让数学变得更生动manim库的使用（3）-坐标系与相机动画

0、概述在上一章中主要讲述了一些常见动画的使用案例。本章介绍与坐标系（包括2维坐标系与3维坐标系）以及像机动画的基本应用1、二维坐标系相关1-1、绘制正弦函数%%manim SinAndCosFunctionPlot -ql -v WARNINGclass SinAndCosFunctionPlot(GraphScene): def __init__(self, **kwargs): # 设置坐标系 GraphScene.__init__(

2021-05-03 00:09:51 2639 8

原创让数学变得更生动manim库的使用（2）-动画绘制

0 概述动画是让人们深刻理解数学原理的关键要素，在上一章中已经介绍manim库的基本使用以及静态元素的绘制。本章主要介绍在各种场景下动画的应用以及效果展示。1、引导动画%%manim PointMovingOnShapes -ql -v WARNINGclass PointMovingOnShapes(Scene): def construct(self): # 创建一个半径为1的圆 circle = Circle(radius=1, color=B

2021-05-02 23:49:56 1842 6

原创让数学变得更生动manim库的使用（1）-基本概念

0、概述数学理论与数学公式的展示总是一件很枯燥的事情，但3b1b的manim动画库在github上开源之后，让这一切变得非常简单。目前这个库已经分成两个版本一个由3b1b自身维护。但作者并没有承诺长期维护该库，所以由专门团队再次基础上研发了相应的社区版，并对该版本进行长期维护。本文的所有案例都基于社区版的官方案例。本文主要介绍该库的基本概念相关的案例，文章主要以代码为主，关键代码都有相关注释。另外本文的运行环境维jupyter这与其他的ide环境运行代码稍微有些不同1、类库引入已经相关测试引

2021-05-02 23:34:41 9731 3

原创使用transformer实现超高质量唐诗生成

0、概述唐诗生成在汉语的nlp领域应用非常广泛，从传统的RNN、LSTM、Attention生成质量被不断提升。随着Transformer模型提出很多NLP的深度学习模型都被改写。那么Transformer在唐诗生成领域的表现如何呢。我们来看一下，本文通过通过实例的方式详细描述了transformer的基本结构，以及唐诗生成的基本步骤。本文使用的框架为tensorflow2.2.1、加载环境import matplotlib as mplimport matplotlib.pyplot as

2021-04-23 23:09:08 2774 8

原创图片视频修复-baidu paddleGAN应用小样

1、概述paddlepaddle（百度飞浆）作为百度的人工智能框架，在发展上可能没有tensorflow与pytorch来的成熟。但在本土化的应用中也有非常的明显的优势，比如汉语的自然语言处理层面。为了保证平台能够快速上手。他也内置了许多有趣的功能模块。本文主要介绍paddleGAN，对抗生成模块的相关接口。可以帮助我们达到一些意想不到的效果。下面的内容将涵盖图片的上色，视频的修复，超频以及卡通头像生成等内容。在运行本文的案例之前您需要先安装paddlepaddle以及panddleGAN具体的安装

2021-04-22 10:19:32 1589 2

原创让您的照片动起来first motion model（1）-关键点抽取模型深度解析

概述目前计算机视觉的发展如火如荼，让老照片动起来让大家惊艳于计算机视觉的发展。该如何实现该功能呢？本文将一步一步的帮您实现。本文将分为几部分来完成。本章主要讲解关键点抽取模型模型结构本文是关于first order motion model的pytorch具体实现引入相关pytorch类库from torch import nnimport torchimport torch.nn.functional as Ffrom imageio import imreadimpor

2021-04-21 13:52:13 3180 9

原创使用yolov3进行目标检测

概述在物体识别的领域应用的算法很多。但yolo系列的模型无疑是不能忽略的one-stage模型，尤其是以darknet53为backbone的yolov3将整体模型的效果提升到了一个新的水平。本文将介绍如何使用yolov3的pre-trained模型来对自己的数据进行训练。yolov3的源码请参考如下github链接https://github.com/ultralytics/yolov31、数据集目录结构首先我们需要使用git命令clone yolov3的源码，这个小伙伴们都比较熟悉，这里不.

2021-04-19 23:00:28 1956 2

原创使用tensorflow预训练模型进行物体识别（2）

1、概述在上一篇我们已经成功的安装了tensorflow与tensorflow 物体检测的API。下面我们将实现使用自定义数据集训练自己的对象检测模型。完成此类工作大概需要以下6个步骤1. 组织工程文件2. 组织训练数据集与标注文件3. 转化训练集为tf_record格式4. 配置训练流程 pipeline5. 监控模型训练过程6. 保存模型参数2、组织工程文件2.1 新建workspace文件夹用于存储所有的工程文件workspace 文件夹在object-detect文件夹下

2021-04-16 10:31:21 1538 4

原创使用tensorflow预训练模型进行物体识别（1）

概述物体识别作为计算机视觉领域的一个典型任务，已经有很多成熟的理论与解决方案。本文主要介绍tensorflow的物体识别API的使用。该API提供了了很多预训练模型。可以让我们快速构建自己的物体识别系统。本文将分几个部分充分展示tensorflow object detect API的使用。本文主要展示物体识别的demo，后面的文章将展开说明如何使用该API来训练自己的的数据。1、TensorFlow对象检测API安装1.1 使用git下载代码库当然在安装该API的前提需要安装好CPU...

2021-04-13 12:07:27 2746 1

原创深度理解期望、方差偏差与方差偏差分解

前言在周志华老师的西瓜书中有关于使用【偏差-方差分解】来度量机器学习模型泛化能力的内容。本文将从数学基础来解释其演进过程。我们先从数学期望开始。1、数学期望概率论是描述现实世界的一个重要学科。我们从现实世界了解数学规律往往是通过一次一次的抽样开始的。我们没做一个事情就会是一次抽样。同样我们也通过做一个事情的经理（也就是多次抽样）来预测，本次做这件事情的成功概率。这本身就是机器学习或者人工智能的过程。所以期望一词也符合我们在场景中的一个定义。当前期望在数学领域并不这样笼统，首先我们需要明确的是

2020-12-08 10:50:35 4005 1

原创使用对抗生成模型生成手写数字

1、概述对抗生成模型是人工智能模型中经常使用的结构，本文介绍使用tensorflow实现手写数字的生成。生成式对抗网络（GAN, Generative Adversarial Networks ）是一种深度学习模型，是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中（至少）两个模块：生成模型（Generative Model）和判别模型（Discriminative Model）的...

2019-02-20 12:13:51 874

原创使用attention机制的seq2seq模型实现论文翻译

1、概述本文是关于attention-seq2seq模型实现中文到英文的翻译。论文的核心gru作为seq2seq模型的基本单元。基本翻译效果如下图所示：2、模型结构整体模型结构如下图所示：相关数学公式如下图所示相关模型说明：FC = 全连接层（dense layer）EO = 编码器（encoder）输出H = 隐藏状态X =解码器（decoder）输入相关公式的模型...

2018-12-04 16:21:31 1857 2

原创论文翻译-通过无监督方法产生不同风格的唐诗

1、摘要原论文 Stylistic Chinese Poetry Generation via Unsupervised Style Disentanglement链接： http://nlp.csai.tsinghua.edu.cn/~yangcheng/publications/emnlp2018.pdf中国人在写诗歌时主要关注诗歌的意境，在不同的意境下，人们可以创作出不同风格的诗歌。这...

2018-11-27 08:32:32 1568

原创论文翻译-通过对齐与翻译联合学习实现机器翻译

1、摘要基于神经网络的机器学习是目前最为流行的一种机器翻译的方法。与传统的统计学翻译不同，这种翻译方式是通过构建一个神经网络来最大限度提升翻译的性能。该模型是encoder–decoders模型家族中的一种。他使用编码器（encoder）将原始句子编码成一个定长向量，然后使用解码器（decoder）来实现翻译。在本文中，我们推测，在encoder–decoder模型架构下，使用定长向量将是提升...

2018-11-01 14:51:31 1118

原创论文翻译-阿里小蜜，基于检索模型和生成模型相结合的聊天引擎

1、摘要阿里小蜜是一款开放领域的聊天机器人引擎，他结合了IR（检索）模型与带有注意力机制的seq2seq生成模型。从效果上来讲，阿里小蜜的表现明显优于只使用某一种单一模型的情况。2、介绍近年来，聊天机器人技术发展非常迅速，比如微软小冰，苹果的siri，谷歌助手等产品层出不穷。与传统的app的按钮式交互不同，聊天机器人允许用户使用自然语言与app进行交互。阿里小蜜是一款在电商领域的一...

2018-10-31 09:49:34 1970

原创成语接龙改版

1、概述上一版的成语接龙中，对汉字进行了严格匹配，我们会发现，在这种情况下，成语接龙的长度很短。如下图所示：原因是什么呢，因为我们一般在玩成语接龙游戏时遵循的原则是可以音同字不同。给予这种需求，我们对之前的代码进行一次改版2、代码实现这里我们使用了xpinyin库，这个库的主要功能是将汉字转为拼音，这里也可以看到python作为一种胶水语言方便易用的特性。请参考如下代码。...

2018-10-20 15:41:50 1222

原创 python成语接龙

1、概述在python开发中要熟练字符串、列表、元组、字典等多种数据类型的使用，本文通过实现简单的成语接龙，来巩固python中的基础功能。2、处理语料我们可以从互联网上下载成语大全等语料，建议建议对语料进行处理和清洗之后读取到列表（list）中。请参考下面代码：# 读取数据file = open('data/ChengYu.txt','r',encoding='gbk')l...

2018-10-18 15:29:32 6117 1

原创 python开发环境搭建

1、概述python是目前人工智能开发使用最为广泛的语言，随着深度学习、神经网络以及tensorflow等人工智能框架的发展。python的应用也变得越来越广泛。下面截图是tiobe 2018年10月编程语言的排行榜。同样在人工智能编程领域python的表现也是非常优秀的。python是一种开源的胶水语言，这种语言的强大能力是他的粘合性。很多开发者会专门为python语言编写各种各样的...

2018-10-17 15:17:21 650

原创 beautiful soup 4.0（bs4）使用css选择器搜索文档树（4）

1、概述上一篇文章中主要介绍了使用bs4搜索文档树，主要使用find与find_all方法。但这种搜索的方法主要专注于标签以及标签的属性。其实在html中可以被用来作为元素选择器的还有一种就是CSS，在css的任何版本中都有选择器的相关定义。在很多框架中我们都是用css的选择器来定位元素的。同样在bs4中，同样提供了一整套基于css的方法来选择元素。2、使用css选择器来搜索文档树在 ...

2018-09-12 16:52:39 1630

原创 beautiful soup 4.0（bs4）搜索文档树（3）

1、概述在上一篇文章中，主要介绍遍历文档树的方法。遍历文档树主要从文档的根节点开始，对文档进行逐一扫描。这是文档解析中一个非常重要的操作。除了这个操作之外，还有一个非常重要方式就是搜索文档树，搜索文档树并不是从根节点开始逐一的对文档进行操作，而是直接在整个文档中检索到我们需要节点以及内容。比如我们想获取一个文档的标题，可以直接索搜title标签，而不需要从本届点逐个进行遍历操作。2、搜索文...

2018-09-12 15:39:20 505

原创 beautiful soup 4.0（bs4）遍历文档树（2）

1、概述在使用爬虫程序对爬取的文档进行处理时，经常要做的一个操作就是遍历文档树。文档以树形结构进行组织，所以遍历文档的操作又叫遍历文档树。beautiful soup本身提供了很多遍历文档树的方法，本文主要讨论遍历文档树的方法。2、遍历文档树2.1 准备工作本文将使用公众号的文章作为遍历的对象，所以首先需要先把整个文档抓取下来，并将多余的元素去除掉，只保留文档的主体部分以保证文档分...

2018-09-10 17:34:00 2642

原创 beautiful soup 4.0（bs4）基本应用(1)

1、概述人工智能行业的发展是以大数据为基础的，在人工智能行业当中，数据比模型本身要重要的多。从一定程度上来讲大量优质的数据可以弥补模型的缺点。而大数据所所涉及的范畴会非常的广泛，有很多在垂直行业深耕很多年的企业会积累很多的行业数据。但这种企业毕竟是少数，很多情况下我们需要自己开发爬虫从互联网上抓取数据，而爬虫程序一个非常重要的环节就是对互联网上的网页进行分析，由于网页上的资料和形式千差万别，能...

2018-09-10 13:45:10 668

原创简单的意图分析模型(2)-模型构建

1、概述在之前文章中已经对数据做了比较充分的处理，而且已经转化为张量，可以直接读取到tensorflow中进行训练。在本章中将构建神经网络模型来实现意图分析的训练与预测。2、构建神经网络为了更好的构建模型首先对输入数据进行简单分析，目前输入的每一个句子是由8个单词构成，每个单词都是一个300维的向量。而输出结果是一个整数的用于代表他们意图的编号。如下图所示：2.1 构建卷积神经...

2018-08-28 11:37:02 1579

原创简单的意图分析模型(1)-数据处理

1、概述在聊天场景中有很多情况下需要对用户的意图进行分析。这些分析功能基本上就是自然语言分类模型的变种。从技术难度上来讲这种模型实现比较简单。但要保证效果主要受一下几个方面的制约。词向量的准确程度语料的多少模型的选择词向量是一个多维的坐标，用于在高纬度空间中的距离表示两个词之间的相似度。所以词向量能否准确的表示词与其相关词的关系会直接影响到整个神经网络的推理能力，以及对于新预料的...

2018-08-27 16:01:43 3990

原创在tensorflow中使用wide&deep模型（1）-模型及应用场景简介

1、概述人工智能的最终目的是为了模拟人的思维状态。而相对于传统的程序而言，人脑的工作机制是非常复杂的。总体来讲人脑的主要功能有一下两个：记忆推理记忆是对已经见过的物体的总结能力，而推理是将这里记忆数据进行泛化，也就是推广到未知事物的能力。能否使用机器学习模型来模拟这两方面的能力呢。本章节将使用wide&deep模型来实现。如下图所示：在该模型中我们将wide模型由于特...

2018-08-21 10:28:17 1751 1

原创深入理解词向量-词向量的可视化

1、概述词向量是自然语言分词在词空间中的表示，词之间的距离代表了分词之间的相似性，我们可以使用gensim,tensorflow等框架非常方便的来实现词向量。但词向量在词空间的分布到底是什么样的，如何更好的理解词向量是一个非常重要的问题。本文将使用tensorbord以及相关的降维技术在三维空间中模拟词向量在高维空间的分布。2、训练词向量词向量的训练是一个无监督的学习过程，这并不是本文...

2018-08-16 17:47:49 10438 10

原创自然语言话题分析-从NMF矩阵分解模型说起

1、概述我们在接触自然语言领域都会涉及到基于监督学习与非监督学习的文本分类，在非监督学习领域会提到lsa、lda主题模型的实现。但之前的讨论都是基于工具层面的。其实这些模型的基础算法都是NMF模型分解。可以我们不会对文本从底层去实现这样的算法。但了解其实现的机制还是非常有帮助的。2、关于NMF矩阵NMF的思想：V=WH（W权重矩阵、H特征矩阵、V原矩阵），通过计算从原矩阵提取权重和特征...

2018-08-15 16:54:07 1918

原创使用nltk处理中文语料（1）- 统计相关

1、概述nltk作为自然语言处理（nlp）领域里经常被使用的一款工具。本身自带的语料大部分是英文的，其实跟对中文文档，稍作处理之后也是可以使用的，这里主要介绍nlp在中文领域的基础应用。2、nltk安装关于nltk的安装网上有很多的文章介绍，可以使用pip install nltk 命令非常方便的安装nltk。一般在安装完成之后需要使用download命令来下载相关的语料库，这些语料库...

2018-08-10 15:45:11 18739 8

原创叙事文章的生成（论文翻译）

1、概述本文章是对国外一篇论文【 2002 Elsevier Science B.V.】的翻译，主要介绍了一种叙事文章的生成。一直以来，由于过度关注对故事语法与情节设计，叙事文章的生成的写作质量很差。此外，迄今为止的自然语言生成系统还不能客观地再现自然发生的叙事的多样性或复杂性。本文主要涵盖一下内容。以叙事文章与语言学为基础，提出了一个叙事推断模型。我们将描述故事的主题结构，以及叙...

2018-08-01 10:44:45 1170

原创 tensorflow 导入数据（3）

1、概述从文件读取数据时，往往是需要数据转换时，尤其对于多维数据，在使用文件形式进行存储时，除了tfrecord文件格式化，其他的文件的存储都显得无能为力。所以真正从文件读入的数据需要经过转换之后才能够使用。同样在tensorflow这种以小批次进行梯度下降的框架中，需要打乱数据以及对数据进行batch处理，本文主要讨论这些问题。2、使用Dataset.map() 预处理数据Datas...

2018-07-30 16:09:49 1969

原创 tensorflow 导入数据（2）

1、概述在前一篇文章中详细讨论了迭代器与数据集的相关内容。由于数据集与迭代器是链接原始数据与程序连接的渠道，所以本文主要讨论如何从原始数据中构建数据集，主要涉及以下场景：内存 TFRecord data 文本文件 csv文件2、从内存中读取数据如果所有的数据都以numpy数据组的形式预先保存到了内存当中，那么我们使用Dataset.from_tensor_slices()方法可...

2018-07-28 15:50:43 1297 1

原创 tensorflow 导入数据（1）

1、概述在tensorflow中的输入数据会有很多形式一般有一下几种形式数据以tf.constant的实行直接嵌入到graph中。在这种情况下一般数据量不会很大，应用场景也比较单一以tf.placeholder与feed_dic的形式存在在这种场景下，往往也需要将数据全部读入到内存，转换成tf的张量集合然后再进行处理。在进行大量数据处理时显得的力不从心。以pipel...

2018-07-27 18:24:29 705

原创知识存储-使用python访问neo4j数据库

1、概述之前的章节当中介绍了，neo4j数据库的安装，cypher的查询语言。但在实际开发的情况中，我们更多时候需要使用编程语言来操作图形数据库。例如使用java、php、python来实现相关操作。本章节主要使用python来访问数据库。在进行本章节之前你需要熟悉下列前导知识：熟悉neo4j数据库的基本架构安装配置好neo4j并且数据cypher查询语言的基本语法数据python相关的操作2、安...

2018-07-14 15:15:51 8325 3

原创知识存储-图数据库构建

1、概述之前章节的内容都是对已有的图数据库进行查询，但是进行查询的前提是，已经构建好了一个图形数据库。构建图形数据库同样是一个非常关键的步骤，本章主要介绍对节点、关系、属性的增删改。2、create操作新增节点在创建节点时，可以创建单个节点和多个节点，请参照下面代码create (m)create (x),(y)但是这样的节点毫无意义，所以最基本的应该创建一个带标签的节点，请参照以下代码crea...

2018-07-13 10:35:44 2260

unity3d教程--pdf

空空如也