tensorflow
文章平均质量分 83
马鹤宁
知到极处便是行,行到极处便是知
展开
-
利用生成对抗网络保护通信(learning to Protect Communications with Adversarial Neural Cryptography)附代码
密码技术与我们息息相关,使用密码技术不仅仅能够保证信息的机密性,而且可以保证信息的完整性和可用性,防止信息被篡改、伪造和假冒。一直以来,设计和破解密码都是人类的专利,然而,随着人工智能的发展,Google Brain的研究成果《让神经对抗网络学习保护通信》(learning to Protect Communications with Adversarial Neural Cryptography), 试图让用0和1思考的机器学习对信息进行加密。原创 2018-08-15 18:37:27 · 5175 阅读 · 15 评论 -
TFRecords文件实现不定长图片和标签的存储和读取感悟(2)(更新版)
将不定长图片和标签生成TFRecords文件进行保存,前期是使用PIL模块进行图片的读取,详情见TFRecords文件实现不定长图片和标签的存储和读取感悟(1)(附完整代码),由于每次batch时要求图片的尺寸大小一致,所以就需要定义一个最大宽度(所有图片高度一定)max_width,需要对图片进行补零填充,此种方法怎么说呢,就是有点不讨喜,后来使用cv2模块进行图片的读取,从tfrecord二进...原创 2019-02-25 17:08:20 · 598 阅读 · 0 评论 -
RCNN+CTC(CNN+RNN+CTC)复现细节记录
由于比赛的原因,接触了图像文字识别,即是对输入的图片,识别其中的文字。然而对于现实世界中随机的一张图片,首先需要文字检测,即检测出图片中文字的所在文字,然后再进行文字识别,由于比赛给出的数据不用考虑文字检测部分,所以此篇文章主要介绍文字识别算法CRNN。CRNN算法思想很简单,架构模型为CNN+RNN,CNN用于提取图片的特征,然后转换成特征序列,作为RNN的序列输入,RNN网络用于预测序列,...原创 2019-01-03 10:43:45 · 8341 阅读 · 10 评论 -
SVT(Street View Text)数据集的处理
Street View Text数据集图像来源自于Google Street View,数据集种的图像包含好质量和低质量的图像,通常低质量图片居多。下载的数据集种包含两个文件,train.xml和test.xml文件。格式如下:<?xml version="1.0" encoding="utf-8"?><tagset> <image> ...原创 2018-12-21 22:19:22 · 4519 阅读 · 1 评论 -
TFRecords文件实现不定长图片和标签的存储和读取感悟(1)(附完整代码)
最近一段时间接触到用tfrecord储存数据和读取,期间踩了数之不尽的坑,在消bug的路上艰难行走,所以在这里记录下我所遇见过的各种坑,望共勉。 TFRecord是谷歌推荐的一种二进制文件格式,理论上它可以保存任何格式的信息。使用tfrecord时,实际上是先读取原生数据,然后转换成tfrecord格式,在存储在硬盘上。以后使用数据时,就可以从tfrecord文件 解码读出。TFRecor...原创 2018-12-27 11:04:57 · 1227 阅读 · 4 评论 -
图像文字识别初探(一)-CRNN(Convolution Recurrent Neural Network)和DTRN(Deep-text Recurrent Network)
最近参加了一个图像文字识别比赛,之前没有接触过这个方向,所以经过多方查找,目前选定五篇论文,希望能从这五篇论文中找出能解决的方法。图像文字识别初探(一)-CRNN(Convolution Recurrent Neural Network)和DTRN(Deep-text Recurrent Network)图像文字识别初探(二)-FAN(Focusing Attention Network)...原创 2018-12-07 17:30:09 · 4404 阅读 · 1 评论 -
官方卷积神经网络cifar10源码的学习笔记(多块GPU)
先前只有自己的游戏本有一块GTX1050的GPU,所以对于官方的卷积神经网络教程,仅仅是按照自己的理解将教程简单化,具体见博客卷积神经网络:CIFAR-10训练和测试(单块GPU),现如今导师提供了具有两块GTX1080TiGPU 的工作站,硬件条件支持了,所以就将此教程完全实现一遍。源码见:https://github.com/skloisMary/cifar10-CNN1. tf.app....原创 2018-09-21 19:40:24 · 2036 阅读 · 0 评论 -
tensorflow的三种数据输入
tensorflow的数据读取一共有三种方式供给数据(Feeding):在Tensorflow程序运行的每一步,让python代码来供给数据 从文件读取数据:在tensorflow图的起始,让一个输入管线从文件中读取数据 预加载数据:在tensorflow图中定义常量或变量来保存所有数据(仅仅适用于数据量比较小的情况)供给数据tensorflow的数据供给机制允许你在tensorfl...原创 2018-08-22 10:49:19 · 7762 阅读 · 1 评论 -
卷积神经网络:CIFAR-10训练和测试(单块GPU)
正好闲暇,将前段时间搁浅的官方cifar-10的例子运行了一遍。我只有一个GPU,所以并没有完全照搬官方的代码, 而是在此基础上,结合自己的理解,对代码进行了修改,总共有三个子文件,每个文件具体作用如下表所示。文件 作用 cifar10_input.py 读取本地CIFAR-10的二进制文件格式,定义函数distorted_inputs获得训练数据和inputs函数获取测试数...原创 2018-08-22 15:34:52 · 11656 阅读 · 2 评论 -
tensorflow的可视化工具tensorboard(附代码)
Tensorboard作为tensorflow的可视化工具,目的就是为了方便tensorflow程序的理解、调试和优化。TensorBoard通过读取Tensorflow 的事件文件来运行。Tensorflow的事件文件中包括运行中涉及到的主要数据。使用TensorBoard展示数据,需要在执行Tensorflow的计算图中,将各种类型的数据汇总并记录到日志文件中。然后使用TensorBoar...原创 2018-08-14 20:41:20 · 2070 阅读 · 0 评论