一只小金毛zy-CSDN博客

原创【Pytorch框架实战】之Mask-Rcnn实例分割

【Pytorch框架实战】之Mask-Rcnn实例分割一、内容上次讲了Faster-RCNN网络，其主要由backbone的卷积网络、实现Boxes选择的区域推荐网络RPN、最终的分类回归。何凯明大作Mask-RCNN简单说就是在RPN之后得到对齐ROI对齐区域，完成了一个全卷积的像素分割分支，Mask-RCNN的网络结构如下：boxes：预测矩形的左上角与右下角坐标(x1,y1,x2,y2) [Nx4]labels: 预测每个对象标签scores：预测每个对象的得分，在0~1之间，大于阈值T的

2020-08-11 17:44:31 1864

原创【Pytorch框架实战】之Faster-Rcnn实现目标检测

【Pytorch框架学习】之Faster-Rcnn实现目标检测一、内容最近在参加kaggle的全球小麦检测大赛，需要学习目标检测的相关知识，后面也会陆续更新自己的比赛过程，自己从最经典的几种目标检测框架开始学习。这次学习的是Faster-Rcnn，采用官方的预训练好的权重，后面也会和大家分享如何训练自己的数据。目标检测就是判断图像中目标的位置，2012年前大多使用传统方法或机器学习方法，比如滑动窗口、Hog特征等。深度学习时代，出现了两种主流框架，一种以RCNN为代表的两级检测框架，一种是YOLO，S

2020-07-07 10:29:19 4429 1

原创【医学图像分割网络】之ScSE U-Net网络PyTorch复现

【医学图像分割网络】之SCSE U-Net网络PyTorch复现1.内容U-Net网络算是医学图像分割领域的开山之作，我接触深度学习到现在大概将近大半年时间，看到了很多基于U-Net网络的变体，后续也会继续和大家一起分享学习。这次分享ScSE+U-Net的一个改进版。[2018-MICCAI-Roy] Concurrent Spatial and Channel ‘Squeeze & Excitation’ in Fully Convolutional Networks1）这篇文章是针对医学

2020-07-03 18:19:37 4143 1

原创【医学图像分割网络】之Res U-Net网络PyTorch复现

【医学图像分割网络】之Res U-Net网络PyTorch复现1.内容U-Net网络算是医学图像分割领域的开山之作，我接触深度学习到现在大概将近大半年时间，看到了很多基于U-Net网络的变体，后续也会继续和大家一起分享学习。这次分享ResNet+U-Net的一个改进版，ResNet本身就是一个十分优秀的backbone，目前应用仍然十分广泛，我们融合进ResNet后，我们就可以使得U-Net进行迁移学习了。1.将Resnet作为encoder替换U-Net原始结构2.U-Net提出时间较早，当时还没

2020-06-20 16:16:10 14897 19

原创【医学图像分割网络】之U-Net网络PyTorch复现

【医学图像分割网络】之U-Net网络PyTorch复现1.内容U-Net网络算是医学图像分割领域的开山之作，我接触深度学习到现在大概将近大半年时间，看到了很多基于U-Net网络的变体，后续也会继续和大家一起分享学习。我现在正常拿到一个分割任务时，都是先拿U-Net网络进行测试，一般U-Net跑出的模型精度是非常高的，虽说论文出的早，但是确实经典，在很多分割任务上表现不俗，优点和网络结构就不谈了，很多博客都有详细的介绍，论文也说的很清楚，这里直接上代码。这里提出的是，很多博客都不是按照原始作者论文里的

2020-06-09 21:02:09 2649

原创【阿里天池新人赛】之街景字符识别（5）

【阿里天池新人赛】之街景字符识别（5）正式赛时间：2020.5.14-2020.6.24比赛网址：https://tianchi.aliyun.com/competition/entrance/531795/introduction上次介绍了如何预测模型和提交结果，这次介绍一些细节提升分数。1.模型更换模型有很多，都可以进行尝试，ResNet、VGG、Inception v3、EfficientNet等等，但是注意模型过拟合问题，需要恰当选取。ResNet50model_conv = mode

2020-06-02 20:59:35 522

原创【阿里天池新人赛】之街景字符识别（4）

【阿里天池新人赛】之街景字符识别（4）正式赛时间：2020.5.14-2020.6.24比赛网址：https://tianchi.aliyun.com/competition/entrance/531795/introduction上次介绍了如何训练模型，这次介绍生成测试文件和提交结果。数据预测（test.py）import pandas as pdimport os, sys, glob, shutil, jsonimport torchfrom torch.utils.data impo

2020-05-30 17:22:49 482 2

原创【Pytorch框架学习】之分类应用中迁移学习网络修改总结（3）

【Pytorch框架学习】之迁移学习网络分类总结（3一、内容在做图像分类应用时，常常会使用一些经典的预训练网络，比如ResNet、VGG、Inception、DenseNet、EfficientNet、ResNeXt等。但是通常都是在ImageNet上预训练的，所以不能直接使用，因此需要最一些层的修改，这里总结了几种，方法是一样的，这里以二分类为例。二、代码import torch.nn as nnimport torchvision.models as modelsnum_class =

2020-05-27 18:01:36 473 1

原创【Pytorch框架学习】之线性回归与逻辑回归（2）

【Pytorch框架】之线性回归与逻辑回归（2）一、线性回归import torchimport matplotlib.pyplot as plttorch.manual_seed(10)# 学习率lr = 0.05# 创建训练数据x = torch.rand(20, 1) * 10 # x data (tensor), shape=(20, 1)y = 2*x + (5 + torch.randn(20, 1)) # y data (tensor), shape=(20, 1)

2020-05-26 17:22:47 383

原创【阿里天池新人赛】之街景字符识别（3）

【阿里天池新人赛】之街景字符识别（3）正式赛时间：2020.5.14-2020.6.24比赛网址：https://tianchi.aliyun.com/competition/entrance/531795/introduction前两篇介绍了如何进行数据读取和模型搭建的内容，这次主要介绍如何进行搭建训练网络。采用之前介绍的定长字符识别思路。在赛题数据集中大部分图像中字符个数为2-4个，最多的字符个数为6个。因此可以对于所有的图像都抽象为6个字符的识别问题，字符23填充为23XXXX，字符231填充为

2020-05-26 14:55:45 540 1

原创【阿里天池新人赛】之街景字符识别（2）

【阿里天池新人赛】之街景字符识别（2）正式赛时间：2020.5.14-2020.6.24比赛网址：https://tianchi.aliyun.com/competition/entrance/531795/introduction1.数据读取（dataset.py）由于本次赛题我们使用Pytorch框架，接下来将是解决赛题的第一步使用Pytorch读取赛题数据。在Pytorch中数据是通过Dataset进行封装，并通过DataLoder进行并行读取。所以我们只需要重载一下数据读取的逻辑就可以完成

2020-05-23 17:00:02 518

原创【阿里天池新人赛】之街景字符识别（1）

【阿里天池新人赛】之街景字符识别（1）正式赛时间：2020.5.14-2020.6.24比赛网址：https://tianchi.aliyun.com/competition/entrance/531795/introduction1.赛题数据赛题来源自Google街景图像中的门牌号数据集（The Street View House Numbers Dataset, SVHN），并根据一定方式采样得到比赛数据集。数据集报名后可见并可下载，该数据来自真实场景的门牌号。训练集数据包括3W张照片，验证集

2020-05-20 09:15:51 846 1

原创【Pytorch框架实战】之CIFAR-10图像分类

【Pytorch框架实战】之CIFAR-10图像分类1.main.pyimport torchfrom torchvision import datasetsimport torch.nn as nnfrom torch.utils.data import DataLoaderimport torchvision.transforms as transformsimport torc...

2020-05-06 08:34:46 604

原创【Pytorch框架学习】之张量的创建和操作（1）

【Pytorch框架】之张量的创建（1）一、代码import torchimport numpy as nptorch.manual_seed(1)# =============================== exmaple 1 ===============================# 通过torch.tensor创建张量# flag = Trueflag = F...

2020-04-29 16:16:31 280

原创【迁移网络学习实战】- Kaggle猫狗分类大赛 - 多模型融合 - 前1.7%

【迁移网络学习实战】- Kaggle猫狗分类大赛 - 前1.7%数据集下载：链接：https://pan.baidu.com/s/1AIj0FhdCQPeAWg4Sw7DEOQ提取码：aejj一、内容想要将深度学习应用于小型图像数据集，一种常用且非常高效的方法是使用预训练网络。预训练网络是一个保存好的网络，之前已在大型数据集（比如在ImageNet数据集140万张标记图像）上训练好...

2020-03-29 16:50:14 879

原创【迁移网络学习实战】- Kaggle猫狗分类大赛 - 单模型测试 - 前7.8%

【迁移网络学习】- Kaggle猫狗分类大赛（1）数据集下载：链接：https://pan.baidu.com/s/1AIj0FhdCQPeAWg4Sw7DEOQ提取码：aejj一、内容想要将深度学习应用于小型图像数据集，一种常用且非常高效的方法是使用预训练网络。预训练网络是一个保存好的网络，之前已在大型数据集**（比如在ImageNet数据集140万张标记图像）**上训练好。如果这个...

2020-03-29 16:28:28 634 2

原创【卷积神经网络可视化】之热度图可视化

【卷积神经网络】之热度图可视化一、内容深度学习一直被人们称为**“黑盒子”**，即内部算法不可见。但是，卷积神经网络(CNN)却能够被可视化，通过可视化，人们能够了解CNN识别图像的过程。介绍三种可视化方法：1.卷积核输出的可视化(Visualizing intermediate convnet outputs (intermediate activations)，即可视化卷积核经过激活...

2020-02-04 17:17:27 4009 1

原创【经典卷积神经网络】之ResNet分析及实现物体识别

【经典卷积神经网络】之ResNet分析及实现物体识别一、内容深度卷积网络一开始面临的最主要的问题是梯度消失和梯度爆炸。那什么是梯度消失和梯度爆炸呢？所谓梯度消失，就是在深层神经网络的训练过程中，计算得到的梯度越来越小，使得权值得不到更新的情形，这样算法也就失效了。而梯度爆炸则是相反的情况，是指在神经网络训练过程中梯度变得越来越大，权值得到疯狂更新的情形，这样算法得不到收敛，模型也就失效了。当然...

2020-01-14 15:26:13 1334

原创【经典卷积神经网络】之VGGNet分析及实现CIFAR-10分类

【经典卷积神经网络】之VGGNet分析及实现CIFAR-10分类一、内容VGGNet 是牛津大学计算机视觉组（Visual Geometry Group）和谷歌 DeepMind 一起研究出来的深度卷积神经网络，因而冠名为 VGG。在2014年的 ILSVRC 中取得了第二名的成绩，可能你会问这么厉害的网络为什么不是第一名，因为当年实际提交 VGG 版本时作者并未作进一步的优化。相较于之前...

2020-01-14 14:20:20 2315 3

原创【经典卷积神经网络】之AlexNet分析及实现牛津花卉数据集分类

【经典卷积神经网络】之AlexNet分析及实现一、内容2012年，深度学习三巨头之一、具有神经网络之父之称的 Geoffrey Hinton 的学生 Alex Krizhevsky 率先提出了 AlexNet，并在当年度的 ILSVRC（ImageNet大规模视觉挑战赛）以显著的优势获得当届冠军，top-5 的错误率降至了 16.4%，相比于第二名 26.2% 的错误率有了极大的提升。论文地...

2020-01-14 13:41:07 1785 1

原创【经典卷积神经网络】之Le-Net5分析及实现MNIST手写数据集分类

【卷积神经网络】之Le-Net5一、内容今天和大家一起学习卷积神经网络和深度学习发展历史上具有奠基性的经典论文之一的关于 LeNet-5 网络一文。LeNet-5 是由具有卷积神经网络之父之美誉的 Yann LeCun 在1998年发表在 IEEE 上面的一篇《Gradient-based learning applied to document recognition》上提出来的。论文...

2020-01-14 13:12:45 1023

原创 Opencv DNN:基于SSD实现视频对象检测Python实现

Opencv DNN:基于SSD实现视频对象检测Python实现一、内容OpenCV DNN模块支持常见得对象检测模型SSD，以及它的移动版Mobile Net-SSD，特别是后者在端侧边缘设备上可以实时计算，基于Caffe训练好的mobile-net SSD支持20类别对象检测。训练好的模型我已经上传到百度云：链接：https://pan.baidu.com/s/1zvIw1rkRvY...

2019-12-30 15:38:40 807

原创 Opencv DNN:基于SSD实现对象检测Python实现

Opencv DNN:基于SSD实现对象检测Python实现一、内容OpenCV DNN模块支持常见得对象检测模型SSD，以及它的移动版Mobile Net-SSD，特别是后者在端侧边缘设备上可以实时计算，基于Caffe训练好的mobile-net SSD支持20类别对象检测。训练好的模型我已经上传到百度云：链接：https://pan.baidu.com/s/1zvIw1rkRvYqk...

2019-12-27 10:56:12 2245 8

原创 Opencv:二维码检测与识别Python实现

Opencv:二维码检测与识别Python实现一、内容二维码检测与识别OpenCV在对象检测模块中QRCodeDetector有两个相关API分别实现二维码检测与二维码解析检测QRCodeDetector::detect(InputArray img,OutputArray points)constimg 输入图像，灰度或者彩色图像points 得到的二维码四个点的坐标信息解...

2019-12-24 12:10:22 6895 2

原创【kaggle prices-advanced-regression-techniques】房价预测 - 前14%

得分：0.11569 前14%import numpy as np import pandas as pd#import matplotlib.pyplot as plt#import seaborn as snsimport osfor dirname, _, filenames in os.walk('/kaggle/input'): for filename...

2019-12-17 08:56:03 443

原创【TensorFlow基础】

Tensorflow基础一、什么是TensorflowTensorflow是一个符号式编程的框架。由谷歌大脑开发，2015年开源，是目前业界用的最广泛的深度学习框架之一。该框架可广泛的用于各个终端，服务器端，移动端和嵌入式端等。一个Tensorflow程序通常包含两个部分：构建计算图执行计算图下面来看一个最简单的Tensorflow程序的例子import warnings...

2019-12-17 08:55:29 439

原创【python】- 常用库之Sklearn（5）

1. sklearn简介Scikit-learn(sklearn)是机器学习中常用的第三方模块，对常用的机器学习方法进行了封装，包括回归（Regression）、降维（Dimensionality Reduction）、分类（Classfication）、聚类（Clustering）方法。常用的回归：线性、决策树、SVM、KNN ；集成回归：随机森林、Adaboost、GradientBoo...

2019-12-11 08:59:50 562

原创【python】- 常用库之Matplotlib（4）

Matplotlib简介Matplotlib是一个非常强大的画图工具，对数据的可视化起着很大的作用。Maplotlib可以画图线图，散点图，等高线图，条形图，柱形图，3D图形，图形动画等。安装pip3 install matplotlib #python3中使用这条语句进行安装，在命令行中输入，敲入回车即可#Matplotlib导入import matplotlib.pyplot as ...

2019-12-11 08:58:39 422

原创【python】- 常用库之Pandas（3）

Pandas模块1 数据结构的简介：DataFrame 和 Seriespandas中有两类非常重要的数据结构，就是序列Series和数据框DataFrame.Series类似于NumPy中的一维数组，可以使用一维数组的可用函数和方法，而且还可以通过索引标签的方式获取数据，还具有索引的自动对齐功能；DataFrame类似于numpy中的二维数组，同样可以使用numpy数组的函数和方法，还具有一...

2019-12-10 12:23:08 15852

原创【python】- 常用库之Numpy（2）

常用库之Numpyimport numpy as np1 创建数组#一维数组的创建a=np.array([2,3,4],dtype=np.int32)print(a)print(a.dtype)[2 3 4]int32#多维数组的创建a=np.array([[1,2,3],[2,3,4]])print(a)[[1 2 3] [2 3 4]]#创建全零数组a=...

2019-12-10 12:22:16 322

原创【python】 - 基本语法总结（1）

基本语法2.1 数据类型计算机可以处理不同类型的数据，文本，图形，音视频数据通过转换成数值型数据而被计算机直接所处理，这些直接所处理的数据类型包括：整数、浮点数、字符串、布尔值、空值。2.1.1 整数形如1,2,3,4，…的数字在数学上和程序中的表示方法一样，都属于整数类型。2.1.2 浮点数浮点数是通常现实中所见的小数，比如1.2，1.34,1.0000089等。浮点数在计算机中的...

2019-12-09 10:57:16 367

原创 .nii格式文件批量读取保存为.png格式Python实现

.nii格式文件批量读取保存为.png格式一、内容在医学图像处理中，经常会遇到.nii格式的文件，如何转换为方便的可视化图片格式经常会用到。二、代码# 遍历文件夹import os # nii格式一般都会用到这个包import nibabel as nib # 转换成图像import imageio # 主函数def nii_to_image(): # 读取n...

2019-12-09 10:45:38 3218 3

原创 MNIST手写数字识别：TensorFlow实现

MNIST手写数字识别：TensorFlow实现一、内容本节将和大家学习如何使用TensorFlow实现一个简单的卷积神经网络,使用的数据集是手写数字数据集MNIST,预期可以达到99.2%左右的准确率。本节将使用两个卷积层加一个全连接层构建一个简单但是非常有代表性的卷积神经网络。二、代码# 从TensorFlow自带的数据集导入MNIST数据集from tensorflow.examp...

2019-12-05 10:21:55 238

原创 Opencv:HOG特征与行人检测Python实现

Opencv:HOG特征与行人检测Python实现一、内容HOG特征与行人检测HOG(Histogram of Oriented Gradient)特征在对象识别与模式匹配中是一种常见的特征提取算法，是基于本地像素块进行特征直方图提取的一种算法，对象局部的变形与光照影响有很好的稳定性，最初是用HOG特征来来识别人像，通过HOG特征提取+SVM训练，可以得到很好的效果。HOG特征提取的大致流...

2019-11-29 10:53:16 3237

原创 Opencv:凸包检测提取轮廓Python实现

Opencv:凸包检测提取轮廓Python实现一、原理凸包检测对二值图像进行轮廓分析之后，对获取到的每个轮廓数据，可以构建每个轮廓的凸包，构建完成之后会返回该凸包包含的点集。根据返回的凸包点集可以绘制该轮廓对应的凸包。OpenCV对轮廓提取凸包的API函数如下：convexHull(InputArray points,OutputArray hull,bool clockwise =...

2019-11-26 17:27:15 5028 3

原创 Opencv:基于背景消除与前景Rol提取的运动检测Python实现

1级标题一、内容背景/前景提取视频场景分析中最常用的技术之一就是通过背景消除来提取前景移动对象，得到前景的对象mask图像，最常用的背景消除技术就是通过帧差相减，用前面一帧作为背景图像，与当前帧进行相减，不过这种方法对光照与噪声影响非常敏感，所有好的办法是通过对前面一系列帧提取背景模型进行相减，OpenCV中实现的背景模型提取算法有两种，一种是基于高斯混合模型GMM实现的背景提取，另外一种...

2019-11-24 19:32:45 1607

原创 Opencv:视频颜色识别与跟踪Python实现

Opencv:视频颜色识别与跟踪Python实现一、内容识别与跟踪视频中的特定颜色对象这个是其实图像处理与二值分析的视频版本，通过读取视频每一帧的图像，然后对图像二值分析，得到指定的色块区域，主要步骤如下：1. 色彩转换BGR2HSV2. inRange提取颜色区域mask3. 对mask区域进行二值分析得到位置与轮廓信息4. 绘制外接椭圆与中心位置5. 显示结果其中涉及到的知识...

2019-11-21 13:18:27 4537 1

原创 Opencv:视频、摄像头读写处理Python实现

Opencv:视频、摄像头读写处理Python实现一、内容OpenCV中对视频内容的处理本质上对读取视频的关键帧进行解析图像，然后对图像进行各种处理，OpenCV的VideoCapture是一个视频读取与解码的API接口，支持各种视频格式、网络视频流、摄像头读取。正常的视频处理与分析，主要是针对读取到每一帧图像，衡量一个算法处理是否能够满足实时要求的时候通常通过FPS（每秒多少帧的处理能力），...

2019-11-17 18:39:26 341

原创 Opencv:形态学闭操作Python实现

Opencv:形态学闭操作Python实现一、内容图像形态学 – 闭操作形态学的闭操作也是基于腐蚀与膨胀两个操作的组合实现的闭操作 = 膨胀 + 腐蚀闭操作的作用：闭操作可以填充二值图像中孔洞区域，形成完整的闭合区域连通组件void cv::morphologyEx(InputArray src,OutputArray dst,int op,InputArray kernel...

2019-11-16 19:27:54 888

原创 Opencv:形态学开操作Python实现

Opencv:形态学开操作Python实现一、内容图像形态学 – 开操作形态学的开操作是基于腐蚀与膨胀两个操作的组合实现的开操作 = 腐蚀 + 膨胀开操作的作用：开操作可以删除二值图像中小的干扰块，降低图像二值化之后噪点过多的问题void cv::morphologyEx(InputArray src,OutputArray dst,int op,InputArray ker...

2019-11-16 19:10:36 911

空空如也

空空如也