CV
邂逅模拟卷
末流985里的垫底搬砖狗
展开
-
TensorFlow 19——ch14-词的向量表示:word2vec与词嵌入
代码:https://github.com/MONI-JUAN/TensorFlow 19——ch14-词的向量表示:word2vec与词嵌入目录基本概念1.词嵌入2.获取映射关系 fff方法一:CBOW1.一个词预测一个词2.多个词预测一个词方法二:Skip-Gram训练 Skip-Gram第一步:下载语料库第二步:制作词表第三步:生成batch第四步:建立模型第五步:开始训练第六步:可视化基本概念1.词嵌入词嵌入:将一个词语(word)转换成一个向量(vector),用word2vec表示词嵌.原创 2020-09-16 13:25:39 · 386 阅读 · 0 评论 -
TensorFlow 18——ch13-N VS 1 RNN做两类序列分类器
代码:https://github.com/MONI-JUAN/Tensorflow_Study/tree/master/TensorFlow 18——ch13-N VS 1 RNN做两类序列分类器目录理论数据生成测试 ToySequenceData定义各种参数定义 RNN 分类模型定义损失和准确率训练所有代码理论TensorFlow 15——ch12-RNN、LSTM基本结构数据生成# 这个类用于产生序列样本class ToySequenceData(object): """ 生成序列原创 2020-09-14 15:18:07 · 567 阅读 · 1 评论 -
TensorFlow 17——ch12-Char RNN 文本生成(莎士比亚/诗词)
代码:(https://github.com/MONI-JUAN/Tensorflow_Study/15-17——RNN-LSTM-生成文本先行知识点:TensorFlow 15——ch12-RNN、LSTM基本结构TensorFlow 16——ch12-RNN 和 LSTM 的实现方式目录一、函数定义1.定义输入数据2.定有多层LSTM模型3.定义损失二、训练模型1.生成英文2.生成诗词3.生成C代码一、函数定义1.定义输入数据model.pydef build_inputs(self):原创 2020-09-14 08:49:54 · 586 阅读 · 0 评论 -
TensorFlow 16——ch12-RNN 和 LSTM 的实现方式
目录RNNCellRNN 基本单元LSMT 基本单元MultiRNNCellBasicRNNCell 的 callBasicLSTMCell 的 call展开时间维度RNNCellRNNCell 是 Tensorflow 中的 RNN 基本单元,是一个抽象类,没有办法实体化,要用的是两个子类,一个是 BasicRNNCell ,一个是 BasicLSTMCell 。RNNCell 有一个 call 函数,是 RNN 的单步计算,调用:(output, next_state) = call(input原创 2020-09-13 17:25:02 · 259 阅读 · 0 评论 -
TensorFlow 15——ch12-RNN、LSTM基本结构
一、RNN1.单层神经网络单层网络的输入是 x,经过变焕 Wx+b 和激活函数f得到输出 y。对于序列形的数据,例如:自然语言处理中的 abcd 连着的单词语音处理中的 abcd 连续声音信号时间序列问题,股票价格之类的2.引入隐状态 h序列形的数据不太好用原始的神经网络处理。为了处理建模序列问题,RNN引入了隐状态 h(hidden state)的概念,h 可以对序列形的数据提取特征,接着再转换为输出。其中:圆圈方块表示向量箭头表示对向量变换U、W是参数矩阵b是偏置项参原创 2020-09-13 12:50:39 · 517 阅读 · 0 评论 -
TensorFlow 14——ch11-CycleGAN 与 非配对图像转换
目录一、CycleGAN 原理1.损失函数2.定义模型循环一致性损失生成器损失判别器损失调用损失二、苹果到橘子1.下载数据集2.转换成 tfrecords 格式3.训练模型4.查看训练情况5.导出模型6.测试模型三、男性到女性1.下载数据集2.转换成 tfrecords 格式3.训练模型4.查看训练情况四、书上的一些效果展示一、CycleGAN 原理1.损失函数CycleGAN 与 pix2pix 的不同点在于,可以利用不成对数据训练出从 X 空间到 Y 空间的映射。例如用大量照片和油画图片可以学习.原创 2020-09-12 14:42:36 · 562 阅读 · 0 评论 -
TensorFlow 13——ch10-超分辨率 部分函数说明
数据集用的是COCO数据集,上次12G那个 train2014.zip ,下不下来,就看看代码了。在地址http://msvocds.blob.core.windows.net/coco2014/train2014.zip 下载COCO数据集。看几个重要的函数def create_op(func, **placeholders):def create_op(func, **placeholders): '''【重要】 将 Tensorflow 中的函数变成普通函数 Tenso原创 2020-09-12 11:07:50 · 211 阅读 · 0 评论 -
TensorFlow 12——ch09-pix2pix模型 与 自动上色技术
目录一、概念1.GAN缺陷2.cGAN3.GAN 和 cGAN对比4.应用5.pix2pix 模型二、pix2pix1.下载数据集2.查看数据集3.训练模型4.查看训练情况5.测试模型6.其他数据集a)为食物图片上色b)为动漫图片上色一、概念1.GAN缺陷使用 GAN 可以对样本进行无监督学习,然后生成全新的样本。但虽然能生成新的样本,却无法确切控制新样本的类型。如使用 GAN 生成 MNIST 数字,虽然可以生成数字,但生成的结果是随机 的,因为是根据输入的随机躁声生成图片,没再办法控制模型生成的原创 2020-09-11 15:45:53 · 1267 阅读 · 0 评论 -
TensorFlow 11——ch08-GAN和DCGAN入门
目录一、基本概念1.GAN 的原理2.交叉熵损失3.DCGAN的原理二、生成MNIST图像1.下载数据集2.训练3.训练结果三、使用自己的数据集训练1.下载数据集2.训练模型3.测试模型4.测试效果一、基本概念GAN 的全称为 Generative Adversarial Networks,意为对抗生成网络。DCGAN 将 GAN 的概念扩展到卷积神经网络中,可以生成质量较高的图片样本 。1.GAN 的原理有两个网络,一个是生成网络G(Generator),一个是判别网络D(Discrimina.原创 2020-09-10 18:44:49 · 485 阅读 · 0 评论 -
TensorFlow 10——ch07-图像风格迁移
概念内容损失和风格损失内容损失(Content Loss)LcontentL_{content}Lcontent描述原始图像和生成图像在 内容 上的差异;风格损失(Style Loss)Gram矩阵(卷积层特征)描述原始图片中的 风格 ;用途利用内容损失还原图像内容;利用封给说你是还原图像风格;风格迁移:还原图像的时候还原令一张图像的风格。原始图像风格迁移 对比 快速图像风格原始:Ltotal(p→,a→,x→)L_{total}(\overrigh原创 2020-09-09 12:45:50 · 1216 阅读 · 0 评论 -
TensorFlow 09——ch06-人脸检测和人脸识别
目录一、第一部分1.人脸检测和人脸对齐:MTCNN2.深度卷积网络提取特征3.应用二、第二部分1.准备工作2.下载LFW 人脸数据库3.修改代码4.对LFW进行人脸检测和对齐:5.验证已有模型的正确率6.在自己的数据上使用已有模型代码:https://github.com/MONI-JUAN/Tensorflow_Study/tree/master/ch06-人脸检测和人脸识别百度云链接:https://pan.baidu.com/s/1i4a85oHe5huA5U7pR9N_-w提取码:aldv一原创 2020-09-08 13:37:46 · 473 阅读 · 0 评论 -
TensorFlow 08——ch05-TensorFlow Object Detection 深度学习目标检测
目录准备工作1.编译 research\object_detection\protos 中的 .proto2.把Slim加入PYTHONPATH3.测试安装API成功4.执行已经训练好的模型训练新模型1.下载数据集2.解压并转换3.准备模型4.模型配置文件5.训练新模型代码链接:https://github.com/MONI-JUAN/Tensorflow_Study/ch05-TensorFlow深度学习目标检测数据集和模型较大,可以提前下!链接:https://pan.baidu.com/s/11原创 2020-09-04 17:41:40 · 392 阅读 · 0 评论 -
TensorFlow 07——ch05-理解R-CNN、Fast R-CNN、Faster R-CNN
目录R-CNNFast R-CNNFaster R-CNNR-CNN、Fast R-CNN 、 Faster R-CNN 的对比R-CNN全称:Region-CNN出处:《Rich feature hierarchies for accurate object detection and semantic segmentation》它可以说是第一个成功地将深度学习应用到目标检测上的算法。传统的目标检测方法大多以图像识别为基础。一般可以在图片上使用穷举法选出所高物体可能出现的区域框,对这些区域框提取原创 2020-09-03 14:11:25 · 470 阅读 · 0 评论 -
TensorFlow 06——ch04-玩转DeepDream
目录一、导入Inception模型并查看卷积层二、生成原始的 Deep Dream 图像三、生成更大只寸的 Deep Drearn 图像四、生成更高质量的 Deep Drearn 图像1.怎么提高质量:放大低频梯度2.具体方法:拉普拉斯金字塔梯度标准化3.代码4.效果五、带背景的 Deep Dream 模型代码链接:https://github.com/MONI-JUAN/TensorFlow—玩转DeepDream准备工作:下载预训练的 Inception 模型,ch4 的 tensorflow_i.原创 2020-09-02 16:33:31 · 413 阅读 · 0 评论 -
TensorFlow 05——ch03-Slim微调模型训练satellite
目录一、准备1.准备数据集2.微调训练模型程序flowers.py为satellite.py3.准备Inception V3 模型4.准备训练文件夹二、运行模型三、评估模型四、对单张图片进行识别1. 导出网络结构:2. 导出模型参数:3. 预测:五、所有代码一、准备1.准备数据集在 data_prepare 目录下用 data_convert.py 将图片转换为为 tfrecord 恪式,python data_convert.py -t pic/ \ --train-shards 2 \ .原创 2020-09-01 16:00:59 · 334 阅读 · 0 评论 -
TensorFlow 04——ch02-convolutional做CIFAR-10 识别模型
目录一、实验过程二、CIFAR-10说明三、正文数据下载数据测试开始训练模型查看训练情况四、全部代码一、实验过程1. 下载CIFAR-10 数据python cifar10_download.py2. 测试TensorFlow 的数据读取机制python test.py3. 将CIFAR-10 数据集保存为图片形式python cifar10_extract.py4. 训练模型python cifar10_train.py --train_dir cifar10_train/ --.原创 2020-08-31 10:38:37 · 292 阅读 · 1 评论 -
TensorFlow 03——ch01-convolutional做手写数字识别
如果没有基础的小白可以先看一下:TensorFlow简单演练代码:# -*- coding: utf-8 -*-# @Author : 模拟卷# @Software: PyCharm Tensorflow1.8.0 python3.5.6import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_data'''weight_variable():用来创建卷积核tf.truncated_norm原创 2020-08-29 09:04:29 · 191 阅读 · 0 评论 -
TensorFlow 01——ch01-softmax regression做手写数字识别
# -*- coding: utf-8 -*-import tensorflow.compat.v1 as tftf.disable_v2_behavior()from tensorflow.tutorials.mnist import input_data # 导入MNIST教学的模块mnist = input_data.read_data_sets("MNIST_data/", one_hot=True) # 读取数据W = tf.Variable(tf.zeros([784, 10]))原创 2020-08-27 17:08:01 · 179 阅读 · 0 评论 -
【论文浅读】《MAP-Net: Multi Attending Path Neural Network for Building Footprint Extraction from Remote S》
创新思想:文章提出了多路径神经网络(Multi Attending Path Neural Network, MAP-Net),用于精确提取多尺度建筑足迹和精确边界。这个网络通过多条平行路径学习保留多尺度特征的空间位置,并且每个阶段都以固定频率提取高层语意特征。主要原理:MAP-Net的整体结构由三个模块组成:(a)多径特征提取网络,在保留空间细节信息的同时提取多尺度高层语义特征;(b)基于注意的多尺度特征自适应压缩和全局空间池增强模块;©上采样和构建足迹提取模块;Conv块:由一系列用于提原创 2020-05-26 17:54:29 · 1909 阅读 · 6 评论 -
【论文浅读】《Deep Pyramidal Residual Networks for Spectral–Spatial Hyperspectral Image Classification》
创新思想:文章提出了一种专门针对高光谱图像分类(Hyperspectral Image Classification, HSI)问题的深层CNN体系结构,称为高光谱金字塔ResNet结构模型(Hyperspectral Pyramidal ResNet)。这个模型用残差的方法逐渐增加了所有卷积层的特征映射维数,并且在金字塔瓶颈残差块中分组,是为了在得到更多的位置信息的同时降低每层的时间复杂度。主要原理:残差模块单元。残差模块单元中不同的卷积模型:左:传统的残差模块中卷积层有相同的拓扑;中:原创 2020-05-26 17:52:06 · 1903 阅读 · 2 评论 -
【论文浅读】《Traffic scene recognition based on deep CNN and VLAD spatial pyramids》
创新思想:为了提高了处理交通场景识别的能力,这篇论文将CNN的特征表示与VLAD编码方案相结合。具体是先用CNN求出区域建议算法生成的图像块的特征值,再用VLAD编码可以使图像表示的形式更紧凑。还用空间金字塔得到空间信息。主要原理:模型的示意图,用FC6表示特征,主成分分析(PCA)方法降维,K-均值聚类进行质心学习,VLAD编码, 支持向量机分类器进行交通场景分类。流程图,和上面一样。训练集中的不同场景。主要实验结果:左:CNN结果直接分类;中:CNN经过PCA、Kmeans、VL原创 2020-05-26 17:49:34 · 237 阅读 · 0 评论 -
【论文浅读】《A Pyramid CNN for Dense-Leaves Segmentation》
创新思想:文章提出了带有多尺度预测的金字塔卷积神经网络,可以从内部纹理中检测和区分叶边界。并用流域算法估计单个叶片周围的闭合边界。主要原理:网络结构,其中I是输入,C是卷积,R是激活,A是n组激活卷积操作,÷是降采样,×是升采样。主要实验结果:不同分辨率下的效果图。这篇文章提出的模型(d)与其他模型的对比(a)(b)©。左边一列是测试原图,中间是轮廓图,右边绿色是真正估计段,蓝色是假阴性,红色是假阳性。结果表明当5个预测层,且仅使用最高分辨率的预测来执行分割效果最好。...原创 2020-05-26 17:48:08 · 224 阅读 · 0 评论 -
【论文浅读】《How to track your dragon: A Multi-Attentional Framework for real-time RGB-D 6-DOF Object Pos》
创新思想:文章提出了一个新的多注意卷积神经网络框架,解决单一已知目标的实时RGB-D 6D姿态跟踪问题。这个框架将多个并行的软空间注意模块集成到多任务卷积神经网络结构中,结合了背景杂波和遮挡处理方法。主要原理:该卷积神经网络的框架。损失函数。主要实验结果:添加不同遮挡物对平移误差和旋转误差的影响。改进算法之后旋转误差的减小。对于不同目标,该模型与其他模型的对比。其中左图为“龙”,右图为“饼干罐”。不同策略下的效果对比。手上是一个“龙”的物体,右图是该模型预测“龙”的位置的结原创 2020-05-26 17:45:17 · 191 阅读 · 0 评论 -
【论文浅读】《Spectral Pyramid Graph Attention Network for Hyperspectral Image Classification》
创新思想:这篇文章提出了新的结构称为光谱金字塔图注意网络(Spectral Pyramid Graph Attention Network, SPGAT),在高光谱图像分类方面解决了两个问题:一个是现有标准的卷积核忽略了数据点之间的内在联系导致区域划分不好,另一个是在高维且有限的数据量在高维光谱域上连续分布的问题。SPGAT以多个嵌入空间的金字塔形式对多个光谱的信息进行编码,基于谱特征空间连接的图注意机制,在每个嵌入空间中显式地进行可解释推理。主要原理:SPGAT的架构。三维卷积核。经过二原创 2020-05-26 17:43:59 · 1029 阅读 · 0 评论 -
【论文浅读】《PWC-Net: CNNs for Optical Flow Using Pyramid, Warping, and Cost Volume》
创新思想:文章提出了一种用于光流估计的CNN模型,包括了三个部分:金字塔(Pyramid),扭曲(Warping),代价体积(Cost Volume)。每个画面有前后两个图,用第一个图的估计光流扭曲第二个图的CNN特征,将扭曲后的特征以及第一个图的特征构造一个代价体积,再来估计光流。主要原理:左边是传统的coarese-to-fine方法,右边是这篇文章提出的PWC网络。第一幅图的光流扭曲第二幅图特征的公式。第二幅图被扭曲的光流及第一幅图的光流计算代价体积的公式。损失函数。主要实验结果原创 2020-05-26 17:41:54 · 5473 阅读 · 1 评论 -
【论文浅读】《Contextual Pyramid Attention Network for Building Segmentation in Aerial Imagery》
创新思想:为了改进航空影像中提取建筑物的效果,文章提出了远程金字塔模型(Contextual Pyramid Attention, CPA),捕获远程依赖项来改进不同大小的建筑分段。主要原理:CPA是在ResNet中Block 4的基础上再增加的模块,在多个尺度下卷积激活再卷积,产生一个加权输出,该输出被馈送到FPN解码器。上下文信息的算子以及整合公式。自身信息的算子公式。主要实验结果:评价指标有IoU和Acc:IoU(Intersection over Union)重叠度:实际和预原创 2020-05-26 17:39:00 · 375 阅读 · 0 评论 -
【论文浅读】《Weakly Supervised Attention Pyramid Convolutional Neural Network for Fine-Grained Visual Cla》
创新思想:文章提出了Attention Pyramid Convolutional Neural Network (AP-CNN) 注意金字塔卷积神经网络,提高了对对象子类分类的效率。该网络主要分为两大部分Attention Pyramid和ROI Pyramid:Attention Pyramid:注意金字塔;top-down高层语意、bottom-up低层特征;ROI Pyramid:感兴趣区域导向金字塔;dropblock细化特征、zoom-in消除噪声。主要原理:整体结构:(a)(b)A原创 2020-05-26 17:37:20 · 1297 阅读 · 0 评论 -
【论文浅读】《Generating High-Quality Crowd Density Maps Using Contextual Pyramid CNNs》
创新思想:Contextual Pyramid CNN (CP-CNN):文章提出的上下文金字塔,由以下四个部分组成:Global Context Estimator (GCE):全局上下文估计;Local Context Estimator (LCE):局部上下文估计;Density Map Estimator (DME):密度映射估计;Fusion-CNN (F-CNN):融合CNN;主要原理:整体结构。全局上下文估计(GCE):绿色;局部上下文估计(LCE):蓝色;密度映射原创 2020-05-26 17:34:35 · 387 阅读 · 0 评论 -
【论文浅读】《Augmented Parallel-Pyramid Net for Attention Guided Pose-Estimation》
创新思想:从一个图像中确定每个人的身体部位或关节位置,来判断人体的姿势。这篇文章提出了有“注意局部模块”和“可微的自动数据增强方法”的“增强平行金字塔网”(Augmented Parallel-Pyramid Net)。“注意局部模块”(Attention Partial Module, APM),是从“增强平行金字塔网”生成的不同尺度特征图中提取加权特征得到的。“可微的自动数据增强方法”(Differentiable Auto-data Augmentation),是为了提高估计精度。主要原理:原创 2020-05-26 17:31:46 · 303 阅读 · 0 评论