深度学习
文章平均质量分 61
northeastsqure
这个作者很懒,什么都没留下…
展开
-
深度学习面试题
1.bn为什么可以加速收敛?2.yolov3,v4,v5的区别?3.anchor free代表原创 2021-06-19 21:01:22 · 168 阅读 · 4 评论 -
sort跟踪问答
https://github.com/abewley/sort/blob/bce9f0d1fc8fb5f45bf7084130248561a3d42f31/sort.py#L104https://arxiv.org/pdf/1602.00763.pdf1.KalmanBoxTracker初始化函数中如下代码如何解释? self.kf = KalmanFilter(dim_x=7, dim_z=4) self.kf.F = np.array([[1,0,0,0,1,0,0],[0原创 2021-01-14 12:05:45 · 193 阅读 · 0 评论 -
神经网络基础问答
1.神经网络权值更新时候,W-学习率*(损失函数对w偏导数), 为什么是减?理解1:假设网络是:y=wx, 其中w就是一个数,再具体比如是:x, 其中w=1而目标函数是w=0.75, y=0.75x那么样本是(2,1.5), 网络预测值是:wx=x=2, 即(2, 2)。那么损失函数是E对w求偏倒网络学习目标是predict线向target线靠近,即w 要减小,那么W-学习率*(损失函数对w偏导数) = 1 - 0.1*1=0.9,正在想目标斜率0.75靠近, 这里如果换成...原创 2021-01-05 18:23:26 · 588 阅读 · 1 评论 -
yolov4问答
1.yolov4对于yolov3有哪些改进? 数据增强:mosaic,adversial training mish激活函数2.darknet的新作者是谁? 来自俄罗斯的alexey3.什么是Mish激活函数?图像上看,β=1时的swish和mish差不多啊?为什么mish比swish会好不少呢?https://zhuanlan.zhihu.com/p/139696588 output = x*tanh(ln(1+e^x)) tanh部分,取值范围[0,1), ...原创 2020-12-25 17:22:23 · 694 阅读 · 1 评论 -
pytorch 训练时候不动了
因为用的线程太多, 打开文件太多了导致的,如下步骤1 num_workers变小有助于解决这个问题 train_loader = DataLoader( dataset=train_set, batch_size=args.batchsize, shuffle=True, num_workers=4, pin_memory=True, )2.提高linux limit 参考https://le.原创 2020-12-23 11:55:27 · 4496 阅读 · 0 评论 -
DB:Real-time Scene Text Detection with Differentiable Binarization
1.基本过程网络最终特征层,预测两个图:概率图,和阈值图。概率图是,原始文本mask收缩后的图;阈值图,是文本边界向内、向外扩展后,得到的差集区域,更好的描述文本的边界。合并方法:2.损失函数...原创 2020-12-04 17:06:23 · 186 阅读 · 0 评论 -
gdb远程调试
海思的板子3559AV100跑程序,有时候崩溃,segmentation fault, 很难找到原因, 可以使用gdb远程调试 在板子上运行:/mnt/mtd/gdbserver 10.18.98.200:6666 /mnt/mtd/ai/runtime/dotnetlibbox.so 在pc上跑:./aarch64-himix100-linux-gdb /mnt/mtd/ai/runtime/dotnet 进入gdb后,target remote 10...原创 2020-11-20 08:54:02 · 241 阅读 · 0 评论 -
pytorch 转化到caffe
没有转换成功,因为caffe不支持gather layer. 而pytorch yolov3层,非常容易产生gather, 就算是tensor.view(), slice 都会产生gather运算符。tensorrt也是最近才支持gather运算符。何况已经很久不更新的caffe.mpicaffe的可以支持gather 层,https://github.com/craftGBD/caffe-GBD/blob/master/src/caffe/layers/gather_layer.cpp但是..原创 2020-09-05 09:22:29 · 448 阅读 · 1 评论 -
efficientdet问答
EfficientDet: Scalable and Efficient Object Detectionhttps://arxiv.org/abs/1911.090701.文章采用了哪些主要优化方法,提高性能 1)使用bifpn, 2)使用了复合缩放办法,,对主干、特征网络、方框/分类预测网络一致的缩放:尺度、深度、宽度2.什么是一阶段的目标检测? 直接基于anchor预测,不产生proposal network,例如ssd3.什么是anchor-free的目标检测? ...原创 2020-06-24 19:45:44 · 639 阅读 · 0 评论 -
对 caffe 中Xavier, msra 权值初始化方式的解释
If you work through the Caffe MNIST tutorial, you’ll come across this curious lineweight_filler { type: "xavier" }and the accompanying explanationFor the weight filler, we will use the转载 2016-11-14 17:45:46 · 6237 阅读 · 0 评论 -
linux 命令总结
linux 命令总结精简有用目录1.将目录不含-label.png的文件,加上前缀路径,输出到all.list1.7 把视频段列表转换为网页(加)1.8 从一台机器一个目录烤到另外一个一个机器的目录2.将JPEG文件改变大小,保持横纵比例。3.如何知道一个可执行程序依赖哪些库4.查看导出的库函数5. linux soft link: ln -sf src d...原创 2015-07-25 09:36:17 · 964 阅读 · 0 评论 -
docker 基本使用
-1.安装docker: https://docs.docker.com/install/linux/docker-ce/ubuntu/0. docker内使用gpu, 安装nvidia-docker:https://github.com/NVIDIA/nvidia-docker, 安装后使用:nvidia-container-cli -k -d /dev/tty lis...原创 2017-08-16 20:26:24 · 5883 阅读 · 1 评论 -
darknet yolo 计算mAP,recall
1.生成检测结果文件./darknet detector valid cfg/car.data cfg/car.cfg backup/car_final.weights -out car.txt -gpu 0 -thresh .52.把car.txt 用faster rcnn 中voc_eval计算mAP/home/sam/src/caffeup2date_pyfasterrcnn原创 2017-02-03 18:08:55 · 24606 阅读 · 29 评论 -
代码调试找错总结
1.拼写错误2.如果c/c++,是否丢掉分号3.条件边界错误 找错时候,其它都找了,就尝试,如果出现条件边界时候的情况,程序会不会出问题,例子(如果asignment2[i])==-1,并且 tracks_undet[i]->skipped_frames ++到等于maximum_allowed_skipped_frames,就会出错): for (size_t i原创 2017-02-14 10:56:59 · 527 阅读 · 0 评论 -
caffe CMAKE Error Variables set to NOTFOUND in Installation of Caffe HDF5_hdf5_cpp_Library linked
改cmake/Dependency.txt 29 line:list(APPEND Caffe_LINKER_LIBS ${HDF5_LIBRARIES}${HDF5_HL_LIBRARIES})设置CMakeCache.txt, 中not found的路径 /usr/local/lib64/libhdf5.so就好了原创 2017-01-13 15:29:22 · 1405 阅读 · 0 评论 -
学习深度学习心得
1.开始不要学习封装的很好的大库,caffe, torch7. 而要学习高人的scrip scratch.因为封装的很好的库已经把细节隐藏了,而我们开始要学习的就是这个细节。原创 2015-11-05 09:11:19 · 3369 阅读 · 0 评论 -
import cv2 cv2.VideoCapture('/u01/dataset/h264/3.mp4') segmentation fault
系统中有多个ffmpeg版本。在centos中,删除make install 的。用yum install ffmpeg-devel 解决原创 2016-11-18 16:02:55 · 1560 阅读 · 1 评论 -
error "flag 'tab_complete_word' was defined more than once caffe
I meet the same problem:ERROR: something wrong with flag 'tab_completion_word' in file '/data/software/source/gflags-master/src/gflags_completions.cc'. One possibility: file '/data/software/source转载 2016-11-18 12:31:20 · 2418 阅读 · 0 评论 -
PixelLink: Detecting Scene Text via Instance Segmentation 论文自测题
目录1.目前使用回归方法预测文字位置,包括哪两种预测 :(6分)2.ic2015里面,把室外文字理解分为哪两步?(6分)3.网络输出是否文本,是否可以作为回归结果的置信度?(6分)4.文字检测里面后处理主要有哪些?(6分)5为什么回归是可以去掉的,而是否文本的预测是必不可少的?(6分)6 文字检测只使用语义分割可以吗?(6分)7. pixellink输出有哪两种?(...原创 2018-10-16 16:02:33 · 1017 阅读 · 0 评论 -
CTC(Connectionist temporal classification)测试题
主要参考:1). https://blog.csdn.net/luodongri/article/details/801002972). https://distill.pub/2017/ctc/,及其中文版https://www.zhihu.com/question/47642307 1.ctc 的损失函数是概率,而神经网络里面的损失函数,都是目标值和网络输出的l2算式,为什么c...原创 2018-11-08 18:15:53 · 302 阅读 · 0 评论 -
torch7-- errors using gfx in the tutorial--Cannot find module 'pty.js'--[gfx.js] rendering cell
1.https://github.com/clementfarabet/gfx.js/issues/1 Solved on linux-mint (ubuntu)!In debian-derived "node" is packaged as "nodejs". As result it will fail in many cases. I solved the probl转载 2015-01-04 09:51:04 · 1236 阅读 · 0 评论 -
tensorflow 运行时候遇到 Error in `python': double free or corruption (fasttop)
参考https://github.com/tensorflow/tensorflow/issues/6968我是用pip install --no-binary=:all: --force-reinstall numpy解决的。原创 2019-06-04 14:43:44 · 7304 阅读 · 3 评论 -
tensorflow 激活函数relu6为什么是6
普通relu, y=max(0, x), 相当于无限多个bernoulli分布,即无限多个骰子relu6, y= min(max(0,x), 6), 相当于有六个bernoulli分布,即6个硬币,同时抛出正面,这样鼓励网络学习到稀疏特征。网络里面每一个输出n,相当于n个bernoulli分布的叠加。通过实验发现,用6,效果比较好。所以选用了6参考:https://sta...原创 2019-03-04 18:32:14 · 15435 阅读 · 0 评论 -
关于vgg,训练 text mask, 中遇到的疑问
用vgg做text的mask,像pixellink,east 那样融合conv3_3', 'conv4_3', 'fc7几层特征,得到融合 特征时候,每输出一个特征点,使用输入特征的一行,发现有效果,确实对横长文本,检测了,文本中间有很大的空白也可以检测成一个。但是对于改成纵向就不好了,难道我关于纵向的想法有错吗?纵向我是用features = tf.image.rot90(inputs, 1)...原创 2019-02-27 09:58:02 · 166 阅读 · 0 评论 -
tf.truncated_normal_initializer 还是 slim.initializers.xavier_initializer
下面的history-gram 是slim.initializers.xavier_initializer,还是tf.truncated_normal_initializer原创 2019-03-02 13:00:13 · 1018 阅读 · 0 评论 -
shufflenet使用pdf注释
下面是:结束原创 2019-03-05 14:23:04 · 145 阅读 · 0 评论 -
shufflenet关键点疑问
1.shuffle操作如何做的,是把通道随机排列吗?图c里面的操作,先做transpose,再做reshape,为了工程省时间2.shufflenet 中的block,中处理单元,conv2d, 输入输出通道数目保持不变,为什么?<iframe src="https://drive.google.com/file/d/13aoL1EP0U6iskrMSZajeLHBaZVOh4s...原创 2019-03-05 13:57:40 · 235 阅读 · 0 评论 -
tensorflow 的一个巨坑
slim.conv2d 如果前面没有scope,那么输出全为零花了一天多时间,发现了这个问题原创 2019-02-19 17:50:14 · 173 阅读 · 0 评论 -
关于batchnorm, relu, softmax的思考
relu 并不进行判断性输出,比如神经网络的最终目的是判断性输出,比如是哪一类,需要判断是哪一类需要使用softmaxrelu和batch 搭配使用,相当于引入了,同行竞争机制,对batch norm对应的axis, 淘汰小的一半。...原创 2019-02-17 12:13:37 · 1756 阅读 · 0 评论 -
average pool对detection效果不好?
yolo 作者在https://github.com/DeepScale/SqueezeNet/issues/15,提到,ave pool 损失位置信息,可能对分类有效果。所以他建议,使用ave pool之前的1000 feature map上 做检测。是这样吗?有待实验验证。原创 2016-11-08 16:48:11 · 897 阅读 · 0 评论 -
faster rcnn 改最后一层名字,方框混乱
faster rcnn 更改分类数目,改最后一层,snapshot 没有做转换,可以在lib/fast_rcnn/test.py更改change line:box_deltas = blobs_out['bbox_pred_car'] in lib/fast_rcnn/test.py to following will work:box_deltas = blobs_out['bbox原创 2016-11-08 12:15:12 · 891 阅读 · 2 评论 -
py-faster-rcnn 使用的caffe sync 到最新版本
https://github.com/rbgirshick/py-faster-rcnn/issues/237Maybe you can try to merge caffe master branch into caffe-fast-rcnn.cd caffe-fast-rcnn git remote add caffe https://github.com/BVLC/caf转载 2016-11-08 09:27:14 · 550 阅读 · 0 评论 -
编译ffmpeg + opencv
编译opencv ,依赖ffmpeg ,/usr/bin/ld: cannot find -lavformat 等错误原因事找不到,ffmpeg, 用export, sudo sh -c 'echo "/usr/local/lib" > /etc/ld.so.conf.d/ffmpeg.conf'办法都不行,最后把ubuntu 自带libav的/usr/lib/x86_原创 2015-08-08 12:57:47 · 827 阅读 · 0 评论 -
gcc 编译unset LIBRARY_PATH CPATH C_INCLUDE_PATH PKG_CONFIG_PATH CPLUS_INCLUDE_PATH INCLUDE
file included from ../.././gcc/c-lang.c:24:0:../.././gcc/system.h:499:20: erreur: conflicting types for ‘strsignal’/usr/include/string.h:566:14: note: previous declaration of ‘strsignal’ was hereIn转载 2015-06-12 18:12:11 · 1762 阅读 · 0 评论 -
./pdffigures/pdffigures: /usr/lib/x86_64-linux-gnu/libstdc++.so.6:version `GLIBCXX_3.4.20' not found
./pdffigures/pdffigures: /usr/lib/x86_64-linux-gnu/libstdc++.so.6:version `GLIBCXX_3.4.20' not foundhttps://developer.ibm.com/answers/questions/184266/libstdcso6-version-glibcxx-3420-not-found.html原创 2015-07-02 16:58:26 · 2728 阅读 · 0 评论 -
http://zhangliliang.com/
http://zhangliliang.com/原创 2015-05-27 23:44:05 · 864 阅读 · 2 评论 -
back propagation in practice;GD and SGD
In both gradient descent (GD) and stochastic gradient descent (SGD), you update a set of parameters in an iterative manner to minimize an error function.While in GD, you have to run through ALL the sam原创 2015-03-15 10:51:25 · 823 阅读 · 0 评论 -
Machine Learning by Andrew Ng-----note
The cost function J(θ) is guaranteed to be convex for logistic regression.Adding polynomial features (e.g., instead using hθ(x)=g(θ0+θ1x1+θ2x2+θ3x21+θ4x1x2+θ5x22)) could increase how well we c原创 2015-02-21 11:26:32 · 1289 阅读 · 0 评论 -
torch7 vs caffe
torch像matlab一样方便,速度基本与caffe在一个量级上。调试torch就是调试脚本语言 torch7都封装好了,直接堆就行了 Yann LeCun: Caffe and Torch serve different purpose. Caffe is strictly a convnet training system that gives you relatively原创 2015-01-04 21:54:07 · 2447 阅读 · 0 评论 -
深度学习——参数共享(parameter sharing)
neral network for example: intput --> 1 layer --> 2 layer--> 3layer --> 4 layer --> outputlayer 1:have many feature maps input into layer 2.layer2: have feature maps ,each feature map conn原创 2015-01-16 11:09:41 · 6241 阅读 · 1 评论