2018年10月_z0n1l2

12月 11月 10月 09月 08月 07月 06月 05月

原创机器学习中的求导

基础知识机器学习中常见函数求导幂次(xu)′=uxu−1(x^u)^\prime=ux^{u-1}(xu)′=uxu−1指数(ex)′=ex(e^x)^\prime=e^{x}(ex)′=ex对数(log⁡ax)′=1xln⁡a(\log _ax)^\prime=\frac{1}{x\ln a}(logax)′=xlna1(lnx)′=1x(ln x)^\prime...

2018-10-30 01:44:26 1078

翻译在VOC上训练 darknet yolov3

数据集需要voc2007和voc2012, 目录结构如下 VOCdevkit/VOC2007 VOCdevkit/VOC2012darknet/sctripts/voc_label.py 在VOCdevkit目录下执行该脚本，生成若干txt，里面都是绝对路径其中train.all.txt是所有图片的列表， train.txt是除了voc2007 test以外的图片列表，训练时可以...

2018-10-28 22:49:29 675

原创关于线性分类器的一些总结

线性分类器的分类函数是f(X)=WX+Bf(X) = WX+Bf(X)=WX+B其中XXX是特征，WWW是权重矩阵，其行数等于类别数，B是偏置，如果定义X′=(X,1)X&#x27;=(X,1)X′=(X,1)，分类函数可以写成f(X′)=WX′f(X&#x27;)= WX&#x27;f(X′)=WX′所以以下讨论忽略偏置B。线性分类器输出是一个向量，维度等于类别数...

2018-10-25 00:10:42 1009

转载一个图看懂语义分割框架

来自ICNET的一个图，对理解语义分割框架很有帮助

2018-10-21 01:02:28 1409

翻译实时语义分割ICNET

ICNet for Real-Time Semantic Segmentation on High-Resolution Images作者开源代码特点上图可以很好的说明ICNET的特点，它是第一个出现在上图右上角的方法，同时兼顾分割效果和处理速度。准确率超过60%，对于1024x2048的高分辨率输入，速度达到30FPS，虽然硬件条件也不低。框架论文分析了语义分割各个模块的对速度影响，...

2018-10-21 00:48:20 2694

翻译 VOC

记录VOC上的一些stat-of-artresnetDeep Residual Learning for Image Recognitionresnet接入Faster-RCNN，VOC07+12集合上检测率最高在75%左右

2018-10-18 23:21:06 268

翻译 CIFAR

记录CIFAR上的一些stat-of-artresnetDeep Residual Learning for Image Recognitionresnet最好记录是classification error 6.43%

2018-10-18 23:15:02 392

翻译 ImageNet

记录ImageNet上的一些stat-of-artresnetDeep Residual Learning for Image Recognitionresnet最好记录是top-5 error 3.57%

2018-10-18 23:10:20 882

原创 numpy.transpose()进阶理解

numpy.transpose()函数对二维数组就是矩阵的转置操作，对于高维数组则可以任意交换数组。本以为自己已经理解了它的用法，直到看到如下的代码。import numpy as npimport cv2size = 128mat = np.zeros((2,2,size,size))mat[0,0,:,:] = np.ones((size,size))mat[0,1,:,:]...

2018-10-18 22:48:49 647

翻译 dither

参考dither是为了降低颜色量化时引入的信息损失，利用有限的颜色数目，生成一个视觉上和支持更多颜色数目的图相似的近似图。loyd–Steinberg dithering是比较早期的dither算法，但也是应用最为广泛的算法，以下是其伪码。背后的思想是把量化误差按照固定比例扩散到相邻的后续几个像素上for each y from top to bottom for each x fro...

2018-10-17 23:12:02 3543

转载 PIL Image.Convert() 转换成黑白图

参考Image.Convert()的模式"1"可以把彩色图转换成黑白图，很好奇其转换的依据，搜索到其文档，分为三个步骤彩色图转灰度图依据ITU-R 601-2 luma transform L = R * 299/1000 + G * 587/1000 + B * 114/1000灰度图转二值图默认阈值127，通过point函数可以修改这个阈值dither默认开...

2018-10-17 23:06:00 5562

转载 numpy中的copy和view

出处python中没有传值和传引用的概念，但copy和view有类似的作用。Viewview相当于传引用，view和原始数据共享一份数据，修改一个会影响另一个。slice，array.view(dtype)可以产生view，但array.astype(dtype)产生的不是view x = np.arange(5) print('x = :\n', x) view = x[1...

2018-10-17 20:00:03 3535

要明确train/validation/test三个集合需要先了解什么是hyperparameter。机器学习中模型的参数有的可以通过训练获得最优的值，而有些无法通过训练获得，只能通过人工设置，这部分需要人工设置的参数就是hyperparameters，比如KNN中的K值，神经网络中的网络层数，结构，SVM中的C值等。三个集合在训练中的使用途径如下给定hyperparameters，trai...

2018-10-17 18:11:24 636

原创数据可视化: PCA降低到2维显示

import os,cv2import numpy as npfrom sklearn.decomposition import IncrementalPCAfrom matplotlib import pyplot as pltinput_folders = [ (‘classA/’,‘red’),(‘classB/’,‘blue’) ]H,W = 64,64transformer...

2018-10-16 11:52:52 3546

原创数据可视化: PCA显示特征向量

import os,cv2import numpy as npfrom sklearn.decomposition import IncrementalPCAinput_folder = 'images/'H,W = 72,72comp_num = 5X = []for name in os.listdir(input_folder): path = os.path.jo...

2018-10-16 10:53:18 2180

原创让DL玩斗地主

A SOLUTION TO CHINA COMPETITIVE POKER USING DEEP LEARNING概要当AI遇到游戏才是最有趣的，本文里利用CNN玩斗地主（China Competitive Poker），在一定条件下可以击败人类选手了，也算SOA吧。文中斗地主规则如下三个玩家，一个地主，两个农民每个玩家17张牌，地主可以获得额外的3张牌，但开局前要向农民展示三张可以带...

2018-10-16 01:20:15 1033

原创 gluoncv-FCN

参考gluoncv按照gluoncv的文档中pip install gluoncv方法安装，但是发现这个版本似乎依然有不少问题准备数据pascal_voc.py 这个脚本可以下载需要的四个文集，但是用迅雷下载的发现最后一个benchmark.tgz下载后的的hash码不对，另外三个是对的。但是用wget下载速度有很慢，最后通过修改脚本，绕开了hash校验，这个脚本其实只做三间事情V...

2018-10-15 01:27:19 1180 8

原创 ubuntu 18.04 + opencv 3.4.3 + python 2.7

windows下似乎直接可以从源码编译出cv2.pyd,但这个组合下却总是没有编译出cv2.so,最后发现是要预先安装python-devapt install python-numpyapt install python-devcmake -DCMAKE_BUILD_TYPE=Release ..make -jmake install...

2018-10-13 21:53:06 1022

转载让普通用户使用docker命令

增加docker组 sudo groupadd docker把当前用户加入docker组 sudo gpasswd -a ${USER} docker重启dockersudo service docker restart增加组权限sudo chmod a+rw /var/run/docker.sock...

2018-10-13 17:28:19 1785

翻译 VGG数据预处理

参考文献Very Deep Convolutional Networks for Large-Scale Image Recognition本文的目的目标检测/语义分割等领域都会涉及到预训练模型，一般是在ImageNet上训练出来的一个分类模型，但是ImageNet和cifar/mnist不同，一个图可能包含多个目标目标的尺寸不固定图像尺寸不固定图像长宽比不固定这种集合如何用来训...

2018-10-09 01:12:09 3429

原创 darknet配置参数-w/h/max_crop/min_crop

darknet的cfg文件中的参数w/h: 最终送入网络的尺寸, 如果输入和这个不符合，则通过crop使之符合max_crop/min_crop: 输入图的最小边需要在[min_crop,max_crop]区间内，如果输入和这个不符合，则通过缩放使之符合。另外有一对参数max_ratio/min_ratio和一对参数作用是一样的，具体参见源码 net->max_crop = op...

2018-10-07 17:16:25 2795

原创 darknet-配置参数burn-in

darknet的cfg文件中有一个配置参数: burn_inburn_in=1000这个参数在caffe中是没有的，一旦设置了这个参数，当update_num小于burn_in时，不是使用配置的学习速率更新策略，而是按照下面的公式更新lr = base_lr * power(batch_num/burn_in,pwr)其背后的假设是：全局最优点就在网络初始位置附近，所以训练开始后的bu...

2018-10-07 17:05:20 6506 6

原创 FGSM：从另一个角度观察BP模型（附源码）

什么是FGSMFast Gradient Sign Attatck(FGSM) 是一种很直观的迷惑基于BP算法训练出的模型的攻击方法，出自 Explaining and Harnessing Adversarial Examples。基于FGSM的攻击需要了解目标模型内部细节，其目的也只是降低目标模型的分类精度，并不能控制模型误分后的结果。上图是一个FGSM的例子，左侧第一幅图x可以被目标...

2018-10-06 00:14:31 1835

cuda编程 merge sort

完成的代码，在win10x64+cuda8平台下测试通过，包括知识点 1. cuda编程实现mergesort 2. cmake创建cuda工程

2019-01-13

opencv hogsvm的使用方法

对opencv中的hogsvm进行封装，给出一个例子如何训练/检测

2018-07-16

opencv dnn模块调用caffe模型

利用opencv dnn模块调用caffe 模型，并给出一个训练好的模型（cifar10集合上的image classification模型），cmakelists.txt要设置CMAKE_MODULE_PATH指向opencv#3.3.1的头文件和库的路径

2018-07-15

用命令提示符调用winrar

winrar提供一个命令行接口,可以通过命令行调用winrar,本资源利用python调用该接口,可以自动对两级目录压缩/解压 1. 可以学习winrar的命令行模式 2. 资源很大时,灵活应用这个脚本,可以节省很多人力

2018-07-01

演示c++调用mxnet模型

1. 不适合mxnet初学者, 需要先了解mxnet 2. 包含一个python代码,基于mnist做训练; 训练结果可以通过cpp目录下的cpp文件调用,进行预测. 就是熟悉如何用c++调用mxnet训练结果

2018-06-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

大泽之国