深度学习
P0ny
这个作者很懒,什么都没留下…
展开
-
【DeepLearning学习】1.Python实现卷积操作
思路:采用纯for循环加list实现输入数据[[1,2,3],[1,2,3]]是2维的,相当h=1,w=3。拿2维矩阵卷积来举例,具体思路就是先遍历h,再遍历w,卷积的方式选择是VALID,就是不足卷积核大小的数据就舍弃。这里说一下VALID模式下输出矩阵大小的计算公式,【(H-K_h+1) / s】 ,这里【】代表向上取整,H代表输入大小,K_h代表卷积核大小,【9.5】等于10.。。。哈哈打不出向上取整的符号。# 这些库仅做显示使用from PIL import Imageimport m原创 2020-08-13 21:27:30 · 904 阅读 · 0 评论 -
ade20k 类别
先来个图片这是txt, 每栏用空格隔开Idx Ratio Train Val Name1 0.1576 11664 1172 wall2 0.1072 6046 612 building, edifice3 0.0878 8265 796 sky4 0.0621 9336 917 floor, flooring5 0.0480 6678 641 tree6 0.0450 6604 ...原创 2019-07-18 17:04:00 · 8468 阅读 · 3 评论 -
HF-NET使用记录
HF-Net是用来重定位的,也就是来一个查询帧query,去数据库中查找与哪一个图像匹配。项目地址:https://github.com/ethz-asl/hfnet环境配置首先作者提供了一个训练好的模型可供下载是一个pb文件要求的tensorflow版本是1.12而且cudnn必须是7.1.4,这是运行是报错时提示的CUDA的版本9.0就好Demo脚本# coding: ...原创 2019-07-25 15:34:27 · 3107 阅读 · 10 评论 -
Mask-RCNN之PyramidROIAlign代码赏析
class PyramidROIAlign(KE.Layer): """Implements ROI Pooling on multiple levels of the feature pyramid. Params: - pool_shape: [pool_height, pool_width] of the output pooled regions. Usually...原创 2019-06-21 18:52:23 · 1345 阅读 · 1 评论 -
Image Caption使用记录
最近在搞Image Caption,在Github上找了还多项目,不是环境不支持,就是跑不通.终于最后还是找到了一个可以在win10+python3+Tensorflow上跑通的项目,我只是做的前向预测,并未做训练,因为数据实在太多渣渣电脑跑不起来.当然中间也有很多坑,但不是很多.希望记下来以后可以用到,利己利人.项目地址https://github.com/coldmanck/show-...原创 2018-07-18 13:52:07 · 3132 阅读 · 23 评论 -
tensorflow object_detection api 安装错误记录
没见过这么坑的1.在./reseach/下python3 object_detection/builders/model_builder_test.py报错:Traceback (most recent call last): File "object_detection/builders/model_builder_test.py", line 21, in &a原创 2018-07-07 03:23:31 · 3815 阅读 · 10 评论 -
基于caffe,opencv-python的人脸检测+识别
环境:python3.5 opencv3.4.1网络模型:可以从这个https://www.pyimagesearch.com/2018/02/26/face-detection-with-opencv-and-deep-learning/ 下载,这是一个人脸检测的10层的ResNet+SSD原理:利用训练好的caffe的ResNet-10人脸检测网络来检测并抠出人脸 ...原创 2018-06-27 19:36:08 · 2732 阅读 · 9 评论 -
SoftMax推导,SoftMax-Loss推导
全连接层的输入是最后一个卷积层的输出, 假设是100x4x4(通道数chanel = 100, featureMap = 4x4)的tensor, 输入到全连接层之前需要平展为N*1的向量(N=100x4x4), 这就是X.W是全连接层的参数, T是类别数.得到一个Tx1向量,其值为(-无穷, +无穷).将Logits输入到SoftMax层,输出向量prob(Tx1), 其值为此样本属于每个...原创 2018-10-20 11:03:27 · 1263 阅读 · 0 评论