自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(12)
  • 收藏
  • 关注

转载 OpenCV、Skimage、PIL图像处理的细节差异

在进行图像处理时一点要注意 各个库之间的细微差异,还有要注意图像放缩时插值方法的选择,而且即使是相同的插值方法,各个库的实现也不同,结果也会有些许差异 PIL(RGB) 首先介绍PIL(Python Imaging Library)这个库,这是Python中最基础的图像处理库,主要注意对图片进行处理时w,h的变化. from PIL import Image import numpy a...

2018-12-13 20:35:00 135

转载 插值法(最邻近,双线性,双三次),图像放缩 python实现

插值法的第一次都是相同的,计算新图的坐标点对应原图中哪个坐标点来填充,计算公式为: srcX = dstX* (srcWidth/dstWidth) srcY = dstY * (srcHeight/dstHeight) srcWidth/dstWidth和srcHeight/dstHeight分别表示宽和高的放缩比。 那么问题来了,通过这个公式算出来的srcX,scrY有可能是小数,但...

2018-11-21 10:19:00 938

转载 【论文笔记,action recognition,动作识别】

“Two-Stream Convolutional Networks for Action Recognition in Videos”(2014NIPS) Two Stream方法最初在这篇文章中被提出,基本原理为对视频序列中每两帧计算密集光流,得到密集光流的序列(即temporal信息)。然后对于视频图像(spatial)和密集光流(temporal)分别训练CNN模型,两个分支的网...

2018-10-25 01:05:00 249

转载 【CVPR2017,action recognition,动作识别】Quo Vadis, Action Recognition? A New Model and the Kinetics Datase...

本文只主要有两个贡献。 ImageNet表明在足够大的数据集上训练网络之后,在其他的数据集甚至其它类型的任务上直接使用pre-trained参数初始化能够取得很好的效果。本文探究了在足够大的视频数据集Kinetics上训练了之后在UCF101和HMDB51上能够得到非常好的效果,可以达到在目前最好的效果。 总结了经典的动作分类方法,提出了一个新的结构组合方式,即把3Dconv应用到tw...

2018-10-25 00:55:00 163

转载 【CVPR2018,action recognition,动作识别】Appearance-and-Relation Networks for Video Classification...

Appearance-and-Relation Networks for Video Classification,CVPR2018 Two-tream网络效果好,但是太耗时;2Dconv+LSTM和其他方式的效果又不太好,主要是因为LSTM只能抓住高层次的模糊信息,不能抓住细粒度的运动信息。3Dconv的效果到目前为止也不太好。所以作者提出了一个新的网络结构---ARTNet,用叫做S...

2018-10-25 00:38:00 196

转载 神经网络进阶-用python实现一个完整的神经网络框架并在CIFAR10数据集上调参

  上一个博客中讲解了用python实现一个简单的两层神经网络,我们是把所有的网络层都直接写在了类中。但是作为一个神经网络框架,网络的结构应该是可以由使用者自定义的,这样一来也就不用为每个网络结构都重写所有代码,我们把每一层模块化,在神经网络的类中定义结构时使用这些模块化的层堆叠形成一个完整的神经网络。每一种层,分别实现forward和password两个函数,用来正向计算和反向传播。 ...

2018-10-07 23:20:00 302

转载 神经网络入门-用python实现一个两层神经网络并在CIFAR10数据集上调参

下面是我从cs231n上整理的神经网络的入门实现,麻雀虽小,五脏俱全,基本上神经网络涉及到的知识点都有在代码中体现。 理论看上千万遍,不如看一遍源码跑一跑。 源码上我已经加了很多注释,结合代码看一遍很容易理解。 最后可视化权重的图: 主文件,用来训练调参 two_layer_net.py 1 # coding: utf-8 2 3 # 实现...

2018-10-07 00:24:00 324

转载 损失函数总结以及python实现:hinge loss(合页损失)、softmax loss、cross_entropy loss(交叉熵损失)...

损失函数在机器学习中的模型非常重要的一部分,它代表了评价模型的好坏程度的标准,最终的优化目标就是通过调整参数去使得损失函数尽可能的小,如果损失函数定义错误或者不符合实际意义的话,训练模型只是在浪费时间。 所以先来了解一下常用的几个损失函数hinge loss(合页损失)、softmax loss、cross_entropy loss(交叉熵损失): 1:hinge loss(合页损失...

2018-10-06 21:04:00 1522

转载 python实现knn

邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。 kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。 概念很简单,更多的解释可以参考百度百...

2018-09-29 17:45:00 98

转载 Tensorflow入门实战-mnist手写体识别

1 ''' 2 tensorflow 教程 3 mnist样例 4 ''' 5 import tensorflow as tf 6 from tensorflow.examples.tutorials.mnist import input_data 7 8 #参数设置 9 INPUT_NODE=784 10 OUTPUT_NODE=10 11...

2018-09-06 10:29:00 87

转载 图像标注 python实现-LSTM篇

上一篇文章介绍了RNN的工作原理和在图像标注上的应用,这篇介绍RNN的变体LSTM。 要知道为什么会出现LSTM,首先来看RNN存在什么问题。RNN由于激活函数和本身结构的问题,存在梯度消失的现象,导致 (1)网络结构不能太深,不然深层网络的梯度可以基本忽略,没有起到什么作用,白白增加训练时间。 (2)只能形成短期记忆,不能形成长期记忆。 因为梯度逐层减少,只有比较临近的层梯度才会...

2018-09-01 23:48:00 88

转载 图像标注 python实现-普通RNN篇

RNN介绍 神经网络包含输入层、隐层、输出层,通过激活函数控制输出,层与层之间通过权值连接。激活函数是事先确定好的,那么神经网络模型通过训练“学“到的东西就蕴含在“权值“中。 RNN与普通神经网络最大的不同就是建立了时序和状态的概念,即某个时刻的输出依赖与前一个状态和当前的输入,所以RNN可以用于处理序列数据。 展开之后 箭头上的字母代表权重矩阵,也就是不同层之间的连接。x代...

2018-08-31 00:01:00 346

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除