自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 资源 (1)
  • 收藏
  • 关注

原创 imagehash去重

【代码】imagehash去重。

2024-09-18 15:49:24 282

原创 基于多模态大语言模型的摄像头实时感知交互

调用本地摄像头,通过多模态大语言模型实时感知世界,并进行交互。

2024-09-04 16:53:53 403

原创 视频提示prompt

【代码】视频提示prompt。

2024-07-10 19:44:51 130

原创 朋友圈文案示例

对于一张孩子们在游乐场玩耍的照片:‘孩童的笑声回荡,游乐场成了快乐的王国,纯真岁月的记忆。对于一张动物在自然保护区的照片:‘野性的土地,孕育生命的故事,每一只动物都是自然的孩子。对于一张留着深思表情的人物照片:‘眼中的光芒胜过千言万语,沉思的瞬间,抚摩心灵的深处。对于一张春日花朵盛开的照片:‘春回大地,花开的是生命的希望,也是岁月的馈赠。对于一张公路旅行的照片:‘公路上的风景,串联起旅程的点点滴滴,自由的味道。对于一张孤独背影的照片:‘一个人的旅途,是孤独,也是自由和深刻的思索。

2024-04-09 11:00:22 208

原创 基于深度学习的场景文本检测

基于目标检测方法的文本检测模型,在Faster RCNN的基础上进行了改进,并结合双向LSTM增强了序列提取特征,通过anchor和gt的设计将文本检测任务转化为一连串小尺度文本框的检测。encode输出box,对文本框的点进行重采样,decoder输出polygon,解决旋转角度过大或反向文本的多边形。文本长短不一,基于anchor的目标检测网络很难通过设置合适的anchors去适应不同的样本。基于分割的文本检测方法,延续了psenet的内核思想,提出了可微分二值化模块。

2024-03-14 10:24:59 1200

原创 用prompt测试写的promt是否合理

【代码】用promt测试写的promt是否合理。

2024-03-14 10:14:27 134

原创 docker、nvidia docker离线安装与使用

一、docker离线安装1.安装Dockerrpm -ivh container-selinux-2.107-3.el7.noarch.rpmrpm -ivh containerd.io-1.2.13-3.1.el7.x86_64.rpmrpm -ivh docker-ce-19.03.8-3.el7.x86_64.rpmrpm -ivh docker-ce-cli-19.03.8-3.el7.x86_64.rpm参考:https://blog.csdn.net/u013036495/artic

2021-06-25 15:35:33 919

原创 onnxruntime(c++)模型加密与解密部署

加密onnx模型和解密读取onnx模型示例://加密模型#ifdef WINVERvoid encryptDecrypt(const wchar_t* toEncrypt, int strLength, const wchar_t* key, wchar_t* output){ int keyLength = wcslen(key); for (int i = 0; i < strLength; i++) { ou

2021-06-16 11:53:47 5896 15

原创 win、linux实现nvidia-smi(显卡占用情况)的实时刷新

win实时刷新:cd C:\Program Files\NVIDIA Corporation\NVSMInvidias-smi -llinux实时刷新:watch -n 0 nvidia-smi

2021-04-01 09:35:30 1010

转载 透视变换与仿射变换

1.      仿射变换 1) 用途 旋转 (线性变换),平移 (向量加).缩放(线性变换),错切,反转 2) 方法 仿射变换是一种二维坐标到二维坐标之间的线性变换,它保持了二维图形的“平直性”(直线经过变换之后依然是直线)和“平行性”(二维图形之间的相对位置关系保持不变,平行线依然是平行线,且直线上点的位置顺序不变)。任意的仿射变换都能表示...

2021-01-19 15:01:48 293

原创 半监督生成对抗网络(gan)在分类和检测任务上的流程

半监督:半监督学习是指监督学习与无监督学习的结合,是在含有少量被标记数据的情况下,利用大量未标记图像进行无监督学习从而改善监督学习的性能。半监督GAN用于分类的步骤:将GAN中判别器的输出层替换成softmax分类器,假设训练数据有C类,则softmax输出C+1类,多一个生成器生成的伪图像的概率。由于判断真伪图像的任务是无监督的,因此我们可以利用到大量的未标注样本来进行训练。训练时将未标注图像和标注图像都送入GAN中,生成器用于生成伪图像,判别器用于判别送入其中的是伪图像还是具体某一个类别的真图像

2020-07-16 18:47:24 3554

原创 Tensorrt python接口代码详解

1 build engine(不同模型代码不一)可选择是否添加的代码:(1)workspace size(2)max_batchsize(3)calibrator: float32->int8或fp162 对engine分配内存3 使用builder创建context4 加载数据5 inference操作:(1)Transfer input data to the GP...

2020-01-03 17:19:02 2825 3

转载 BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm、SwitchableNorm总结

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

2019-11-11 15:52:15 229

原创 python实现图像的白平衡,破坏图像的白平衡(冷、暖)和调节图像的亮度

白平衡:让实际环境中白色的物体在你拍摄的画面中也呈现出“真正”的白色。不同性质的光源会在画面中产生不同的色彩倾向,比如说,蜡烛的光线会使画面偏橘黄色,而黄昏过后的光线则会为景物披上一层蓝色的冷调。而我们的视觉系统会自动对不同的光线作出补偿,所以无论在暖调还是冷调的光线环境下,我们看一张白纸永远还是白色的。但相机则不然,它只会直接记录呈现在它面前的色彩,这就会导致画面色彩偏暖或偏冷。破坏白平衡:...

2019-09-23 12:29:09 4286 1

原创 经典深度网络对比(结构、效果、参数、准确率等)

经典CNN的效果和参数对比:准确率vs执行效率:

2019-09-04 11:02:39 1466

原创 安装mmdetection报错:bash: ./compile.sh: 没有那个文件或目录

记录一下mmdetection的版本: 2019.07.29该版本下安装mmdection时不需要输入命令:./compile.sh在进入mmdection路径后只需输入:python setup.py develop即可完成安装。...

2019-08-15 22:21:31 2345 4

原创 基于深度学习的变化检测算法实现完整代码

详解见: https://blog.csdn.net/weixin_39853245/article/details/91650607代码如下:import tensorflow as tfimport numpy as npimport timeimport cv2 as cv# 读取影像path = 'E:/data changing2/'img1 = cv.imread(pa...

2019-07-29 19:20:34 6718 17

原创 HRnetv2、HRnetv2p论文阅读笔记

本文主要讲述了HRnet在图像分割,人脸检测和目标检测人物的应用。论文:High-Resolution Representations for Labeling Pixels and Regions摘要高分辨率表示学习在许多视觉问题中起着至关重要的作用,如姿态估计和语义分割。高分辨率网络(high-resolution network, HRNet)[91]是近年来发展起来的一种用于人体姿态...

2019-07-28 23:30:39 2247 1

原创 深度学习中的优化方法总结(常见方法,动机,思路和优缺点)

随机梯度下降SGD:梯度下降算法(Gradient Descent Optimization)是神经网络模型训练最常用的优化算法:缺点:选择合适的learning rate比较困难:如果数据是稀疏的,我们会想对出现频率低的特征进行快一点的更新,而高频的进行慢一点的更新,这时候SGD就不太能满足要求了SGD容易收敛到局部最优,并且极容易被困在鞍点上,在这种点所有反向上的梯度值都为0(如果...

2019-07-23 22:07:22 1436

原创 python实现数的分组(将任意10个正整数分为2组A和B,要求组A中每个数据的和与组B中每个数据的和之差的绝对值最小)

题目分析:使用穷举法进行求解,需要使用位运算进行辅助求解。解题思路:每一个正整数都可能被分到组A或者是组B,因此总共所有的分组有为2*10 = 1024种可能,去掉组A或者组B为None的情况,总共有1024-2=1022种情况。如果直接用循环体嵌套去遍历每一种情况,需要嵌套10个循环体,这对于代码书写太过复杂了,不可行。因为要分为两组,我们很自然的想到0和1,因此本题正确的解法应使用位运...

2019-07-15 18:00:57 1667

原创 python实现荷兰国旗问题

问题描述:荷兰国旗仅有红、白、蓝三色构成。设有一个仅有红、白、蓝三种颜色的n个条块组成的条块序列,请设计一个时间复杂度为O(n)的算法使得这些红、白、蓝的顺序排好,也就是构成荷兰国旗的。问题分析:这个问题是一道经典的数组排序问题,由于本体要求时间复杂度为O(n),即只能遍历数组中每个元素一次,这里我们采用快速排序算法的思想来解决这个问题。首先将问题抽象化,我们可以用一个数组来存放这三种颜色...

2019-07-15 11:27:21 1873

原创 python实现快速排序算法

def kuaisupaix(a): length = len(a) sort(a,0,length-1)def sort(a,low,high): left = low +1 right = high if low < high: while True: while a[left] <= a[low]...

2019-07-14 00:01:21 514

原创 python实现青蛙跳台阶算法

问题描述:青蛙每次跳台阶每次只能跳一个台阶或两个台阶,跳到第N个台阶总共有多少种跳法解决方法:可以转化为斐波那契数列的方式进行求解,假设要跳N阶台阶,那么第一步有两种跳法:(1)跳一步,后面还有n-1个台阶需要跳;(2)跳两步,后面还有n-2个台阶需要跳。可以看到跳n阶台阶的跳法数等于跳n-1和n-2阶台阶数的和,即f(n) = f(n-1) + f(n-2)求解方式:(1)递归,...

2019-07-09 11:53:42 6087

原创 cvpr2020论文汇总(包含对各种方向的分类,源码等)

https://github.com/extreme-assistant/cvpr2019

2019-07-03 19:32:05 616

原创 基于深度学习的变化检测算法实现

我是研究生期间研究主要研究SAR影像的变化检测,这是一段简单的基于深度学习的变化检测方法,以CNN实现。后续我会把整个代码的思路写上,由于这个是自己写的代码,如果有哪些地方写的不太好请大家见谅,如果有不懂或者发现了问题欢迎大家进行评论。import tensorflow as tfimport numpy as npimport timeimport cv2 as cv# 读取影像p...

2019-06-12 23:04:37 17545 24

原创 Batch Normaliation(批标准化,BN)的作用和缺陷精简总结

BN的作用:(1)加快训练速度,减少了对学习率的要求,可以使用很大的学习率或者较小的学习率,算法也能够快速训练。(2)增加模型的稳定性,有效减少梯度消失/爆炸,提高训练精度。(3)BN具有轻微的正则化效果,在某些情况下可以取消 dropout 和 L2 正则项参数,或者采取更小的 L2 正则项约束参数。(4)减少了人为选择参数的过程(权重的初始化方式,正则化方式的超参数的选择,学习率等)。...

2019-05-27 22:31:48 2309 2

原创 python批量重命名图片

在制作自己的目标检测数据集时我们通常需要把图片的名称变为‘000001’这种格式,下面给出一个批量重命名图片的代码给大家进行参考:import ospath_name=r'G:\data_annimal\data_jiayang1/' # 批量修改的文件夹路径i=0for item in os.listdir(path_name): original_name = os.path....

2019-05-22 00:38:02 2725

原创 深度学习面试:用猫和狗的数据做图像分类,分类的效果不好怎么办?

首先,我们可以通过训练集和测试集的误差曲线来判断:1、如果曲线符合过拟合的表现:可以使用droupout,L1,L2正则化,BN,适当增大学习率或减少训练轮次,扩充数据集等方式改善2、如果测试集误差远大于训练集误差,则有两种情况:(1) 数据集有较多的标注错误或者训练集和测试集的数据分布不一致。(2)欠拟合:可以更换模型,增加训练轮次,减小学习率或使用衰减学习率等方式进行改善。解决上述...

2019-05-19 19:32:32 1711

原创 1*1卷积的作用

(1)实现信息的跨通道交互和整合。(2)对卷积核通道数进行降维和升维,减小参数量。(3)增加非线性

2019-05-19 19:13:54 278

原创 “keep_inds = np.append(fg_inds, bg_inds) (Pdb)”:Tensorflow训练Faster R-CNN中意外中止

问题描述:训练Faster R-CNN时程序中止,没有报错,显示:keep_inds = np.append(fg_inds, bg_inds) (Pdb)。问题原因:问题解决方案:(1)重新整理训练数据集,不能标注太小的框。(2)在文件夹\lib\datasets\下,将文件pascal_voc.py中函数_load_pascal_annotation中的:x1 = float(bbo...

2019-05-16 18:19:10 1409 2

原创 梯度消失和梯度爆炸原因,表现,解决方案

参考:https://blog.csdn.net/qq_25737169/article/details/78847691参考:https://www.cnblogs.com/DLlearning/p/8177273.html一、梯度消失出现的原因:在深层网络中,如果激活函数的导数小于1,那么靠近输入层的参数的梯度因为乘了很多的小于1的数而越来越小,最终就会变为0,例如sigmoid函数,其...

2019-05-10 22:58:56 2009 1

原创 'utf-8' codec can't encode character '\udcd5' in position 177: surrogates not allowed。

练faster rcnn时 报的错,最终发现是因为文件vgg16.ckpt的路径错了。

2019-05-10 11:27:27 908 1

原创 'No module named 'lib.utils.cython_bbox',训练faster-rcnn python3.5版本时报错

报错的原因:python版本不匹配,好多小伙伴装Anaconda时都默认装了3.6版本的python,安装faster rcnn时会生成一个3.6版本的文件,而我们需要的是3.5版本的文件,版本不匹配,所以会报错。试了多种方法,都不可行,不如简单粗暴来的痛快些,解决方法:1 删掉Anoconda重新下载一个python3.5版本的Anaconda2 conda一个新环境我在Anacond...

2019-05-10 11:24:50 10603 10

原创 深度学习面试专用:深度学习500问;文字版吴恩达深度学习,机器学习

文字版吴恩达机器学习,深度学习地址:http://www.ai-start.com/深度学习500问地址:https://github.com/fengdu78/DeepLearning-500-questions,妈妈再也不用担心知识点会有疏漏啦...

2019-05-07 22:48:43 283

原创 Sigmoid激活函数的理解(函数及其导数的图形表示,作用,优缺点)

Sigmoid函数又称logistic函数,在逻辑回归中经常出现。公式为:Sigmoid函数常被用作神经网络的阈值函数,将变量映射到0,1之间,该函数单调递增且以(0,0.5)对称,在两端变化速度较慢。它是神经网络中的激活函数,其作用就是引入非线性。优点:(1)sigmoid函数单调连续,输出范围有限,所以数据在传递的过程中不容易发散(2)由于输出范围为(0, 1),所以可以用作输...

2019-05-07 16:26:25 12884

IC13数据集,前两个task

ICDAR2013数据集,包括文本定位和文本分割两个task,共6个文件夹可供下载,经济实惠,提供给小伙伴们方便下载

2020-09-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除