小小菜鸡升级ing-CSDN博客

原创基于多模态大语言模型的摄像头实时感知交互

调用本地摄像头，通过多模态大语言模型实时感知世界，并进行交互。

2024-09-04 16:53:53 812 1

对于一张孩子们在游乐场玩耍的照片：‘孩童的笑声回荡，游乐场成了快乐的王国，纯真岁月的记忆。对于一张动物在自然保护区的照片：‘野性的土地，孕育生命的故事，每一只动物都是自然的孩子。对于一张留着深思表情的人物照片：‘眼中的光芒胜过千言万语，沉思的瞬间，抚摩心灵的深处。对于一张春日花朵盛开的照片：‘春回大地，花开的是生命的希望，也是岁月的馈赠。对于一张公路旅行的照片：‘公路上的风景，串联起旅程的点点滴滴，自由的味道。对于一张孤独背影的照片：‘一个人的旅途，是孤独，也是自由和深刻的思索。

2024-04-09 11:00:22 711

原创基于深度学习的场景文本检测

基于目标检测方法的文本检测模型，在Faster RCNN的基础上进行了改进，并结合双向LSTM增强了序列提取特征，通过anchor和gt的设计将文本检测任务转化为一连串小尺度文本框的检测。encode输出box，对文本框的点进行重采样，decoder输出polygon，解决旋转角度过大或反向文本的多边形。文本长短不一，基于anchor的目标检测网络很难通过设置合适的anchors去适应不同的样本。基于分割的文本检测方法，延续了psenet的内核思想，提出了可微分二值化模块。

2024-03-14 10:24:59 1434 1

原创用prompt测试写的promt是否合理

【代码】用promt测试写的promt是否合理。

2024-03-14 10:14:27 266

原创 docker、nvidia docker离线安装与使用

一、docker离线安装1.安装Dockerrpm -ivh container-selinux-2.107-3.el7.noarch.rpmrpm -ivh containerd.io-1.2.13-3.1.el7.x86_64.rpmrpm -ivh docker-ce-19.03.8-3.el7.x86_64.rpmrpm -ivh docker-ce-cli-19.03.8-3.el7.x86_64.rpm参考：https://blog.csdn.net/u013036495/artic

2021-06-25 15:35:33 1032

原创 onnxruntime(c++)模型加密与解密部署

加密onnx模型和解密读取onnx模型示例：//加密模型#ifdef WINVERvoid encryptDecrypt(const wchar_t* toEncrypt, int strLength, const wchar_t* key, wchar_t* output){ int keyLength = wcslen(key); for (int i = 0; i < strLength; i++) { ou

2021-06-16 11:53:47 6747 15

原创 win、linux实现nvidia-smi（显卡占用情况）的实时刷新

win实时刷新：cd C:\Program Files\NVIDIA Corporation\NVSMInvidias-smi -llinux实时刷新：watch -n 0 nvidia-smi

2021-04-01 09:35:30 1139

转载透视变换与仿射变换

1. 仿射变换 1) 用途旋转 (线性变换)，平移 (向量加)．缩放(线性变换)，错切，反转 2) 方法仿射变换是一种二维坐标到二维坐标之间的线性变换，它保持了二维图形的“平直性”（直线经过变换之后依然是直线）和“平行性”（二维图形之间的相对位置关系保持不变，平行线依然是平行线，且直线上点的位置顺序不变）。任意的仿射变换都能表示...

2021-01-19 15:01:48 338

原创半监督生成对抗网络（gan）在分类和检测任务上的流程

半监督：半监督学习是指监督学习与无监督学习的结合，是在含有少量被标记数据的情况下,利用大量未标记图像进行无监督学习从而改善监督学习的性能。半监督GAN用于分类的步骤：将GAN中判别器的输出层替换成softmax分类器，假设训练数据有C类，则softmax输出C+1类，多一个生成器生成的伪图像的概率。由于判断真伪图像的任务是无监督的，因此我们可以利用到大量的未标注样本来进行训练。训练时将未标注图像和标注图像都送入GAN中，生成器用于生成伪图像，判别器用于判别送入其中的是伪图像还是具体某一个类别的真图像

2020-07-16 18:47:24 3729

原创 Tensorrt python接口代码详解

1 build engine（不同模型代码不一）可选择是否添加的代码：（1）workspace size（2）max_batchsize（3）calibrator: float32->int8或fp162 对engine分配内存3 使用builder创建context4 加载数据5 inference操作：（1）Transfer input data to the GP...

2020-01-03 17:19:02 2899 3

转载 BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm、SwitchableNorm总结

2019-11-11 15:52:15 259

原创 python实现图像的白平衡，破坏图像的白平衡（冷、暖）和调节图像的亮度

白平衡：让实际环境中白色的物体在你拍摄的画面中也呈现出“真正”的白色。不同性质的光源会在画面中产生不同的色彩倾向，比如说，蜡烛的光线会使画面偏橘黄色，而黄昏过后的光线则会为景物披上一层蓝色的冷调。而我们的视觉系统会自动对不同的光线作出补偿，所以无论在暖调还是冷调的光线环境下，我们看一张白纸永远还是白色的。但相机则不然，它只会直接记录呈现在它面前的色彩，这就会导致画面色彩偏暖或偏冷。破坏白平衡：...

2019-09-23 12:29:09 4632 1

原创经典深度网络对比（结构、效果、参数、准确率等）

经典CNN的效果和参数对比：准确率vs执行效率:

2019-09-04 11:02:39 1600

原创安装mmdetection报错：bash: ./compile.sh: 没有那个文件或目录

记录一下mmdetection的版本： 2019.07.29该版本下安装mmdection时不需要输入命令：./compile.sh在进入mmdection路径后只需输入：python setup.py develop即可完成安装。...

2019-08-15 22:21:31 2403 4

原创基于深度学习的变化检测算法实现完整代码

详解见： https://blog.csdn.net/weixin_39853245/article/details/91650607代码如下：import tensorflow as tfimport numpy as npimport timeimport cv2 as cv# 读取影像path = 'E:/data changing2/'img1 = cv.imread(pa...

2019-07-29 19:20:34 7032 17

原创 HRnetv2、HRnetv2p论文阅读笔记

本文主要讲述了HRnet在图像分割，人脸检测和目标检测人物的应用。论文：High-Resolution Representations for Labeling Pixels and Regions摘要高分辨率表示学习在许多视觉问题中起着至关重要的作用，如姿态估计和语义分割。高分辨率网络(high-resolution network, HRNet)[91]是近年来发展起来的一种用于人体姿态...

2019-07-28 23:30:39 2400 1

原创深度学习中的优化方法总结（常见方法，动机，思路和优缺点）

随机梯度下降SGD:梯度下降算法（Gradient Descent Optimization）是神经网络模型训练最常用的优化算法:缺点：选择合适的learning rate比较困难：如果数据是稀疏的，我们会想对出现频率低的特征进行快一点的更新，而高频的进行慢一点的更新，这时候SGD就不太能满足要求了SGD容易收敛到局部最优，并且极容易被困在鞍点上，在这种点所有反向上的梯度值都为0（如果...

2019-07-23 22:07:22 1646

原创 python实现数的分组（将任意10个正整数分为2组A和B，要求组A中每个数据的和与组B中每个数据的和之差的绝对值最小）

题目分析：使用穷举法进行求解，需要使用位运算进行辅助求解。解题思路：每一个正整数都可能被分到组A或者是组B，因此总共所有的分组有为2*10 = 1024种可能，去掉组A或者组B为None的情况，总共有1024-2=1022种情况。如果直接用循环体嵌套去遍历每一种情况，需要嵌套10个循环体，这对于代码书写太过复杂了，不可行。因为要分为两组，我们很自然的想到0和1，因此本题正确的解法应使用位运...

2019-07-15 18:00:57 1774

原创 python实现荷兰国旗问题

问题描述：荷兰国旗仅有红、白、蓝三色构成。设有一个仅有红、白、蓝三种颜色的n个条块组成的条块序列，请设计一个时间复杂度为O(n)的算法使得这些红、白、蓝的顺序排好，也就是构成荷兰国旗的。问题分析：这个问题是一道经典的数组排序问题，由于本体要求时间复杂度为O(n)，即只能遍历数组中每个元素一次，这里我们采用快速排序算法的思想来解决这个问题。首先将问题抽象化，我们可以用一个数组来存放这三种颜色...

2019-07-15 11:27:21 1993

原创 python实现快速排序算法

def kuaisupaix(a): length = len(a) sort(a,0,length-1)def sort(a,low,high): left = low +1 right = high if low < high: while True: while a[left] <= a[low]...

2019-07-14 00:01:21 539

原创 python实现青蛙跳台阶算法

问题描述：青蛙每次跳台阶每次只能跳一个台阶或两个台阶，跳到第N个台阶总共有多少种跳法解决方法：可以转化为斐波那契数列的方式进行求解，假设要跳N阶台阶，那么第一步有两种跳法：（1）跳一步，后面还有n-1个台阶需要跳；（2）跳两步，后面还有n-2个台阶需要跳。可以看到跳n阶台阶的跳法数等于跳n-1和n-2阶台阶数的和，即f(n) = f(n-1) + f(n-2)求解方式：（1）递归，...

2019-07-09 11:53:42 6290

原创 cvpr2020论文汇总（包含对各种方向的分类，源码等）

https://github.com/extreme-assistant/cvpr2019

2019-07-03 19:32:05 654

原创基于深度学习的变化检测算法实现

我是研究生期间研究主要研究SAR影像的变化检测，这是一段简单的基于深度学习的变化检测方法，以CNN实现。后续我会把整个代码的思路写上，由于这个是自己写的代码，如果有哪些地方写的不太好请大家见谅，如果有不懂或者发现了问题欢迎大家进行评论。import tensorflow as tfimport numpy as npimport timeimport cv2 as cv# 读取影像p...

2019-06-12 23:04:37 18149 24

原创 Batch Normaliation（批标准化，BN）的作用和缺陷精简总结

BN的作用：（1）加快训练速度，减少了对学习率的要求，可以使用很大的学习率或者较小的学习率，算法也能够快速训练。（2）增加模型的稳定性，有效减少梯度消失/爆炸，提高训练精度。（3）BN具有轻微的正则化效果，在某些情况下可以取消 dropout 和 L2 正则项参数,或者采取更小的 L2 正则项约束参数。（4）减少了人为选择参数的过程（权重的初始化方式，正则化方式的超参数的选择，学习率等）。...

2019-05-27 22:31:48 2409 2

原创 python批量重命名图片

在制作自己的目标检测数据集时我们通常需要把图片的名称变为‘000001’这种格式，下面给出一个批量重命名图片的代码给大家进行参考：import ospath_name=r'G:\data_annimal\data_jiayang1/' # 批量修改的文件夹路径i=0for item in os.listdir(path_name): original_name = os.path....

2019-05-22 00:38:02 2763

原创深度学习面试：用猫和狗的数据做图像分类，分类的效果不好怎么办？

首先，我们可以通过训练集和测试集的误差曲线来判断：1、如果曲线符合过拟合的表现：可以使用droupout，L1，L2正则化，BN，适当增大学习率或减少训练轮次，扩充数据集等方式改善2、如果测试集误差远大于训练集误差，则有两种情况：（1）数据集有较多的标注错误或者训练集和测试集的数据分布不一致。（2）欠拟合：可以更换模型，增加训练轮次，减小学习率或使用衰减学习率等方式进行改善。解决上述...

2019-05-19 19:32:32 1791

原创 1*1卷积的作用

（1）实现信息的跨通道交互和整合。（2）对卷积核通道数进行降维和升维，减小参数量。（3）增加非线性

2019-05-19 19:13:54 328

原创 “keep_inds = np.append(fg_inds, bg_inds) (Pdb)”:Tensorflow训练Faster R-CNN中意外中止

问题描述：训练Faster R-CNN时程序中止，没有报错，显示：keep_inds = np.append(fg_inds, bg_inds) (Pdb)。问题原因：问题解决方案：（1）重新整理训练数据集，不能标注太小的框。（2）在文件夹\lib\datasets\下，将文件pascal_voc.py中函数_load_pascal_annotation中的：x1 = float(bbo...

2019-05-16 18:19:10 1457 2

原创梯度消失和梯度爆炸原因，表现，解决方案

参考：https://blog.csdn.net/qq_25737169/article/details/78847691参考：https://www.cnblogs.com/DLlearning/p/8177273.html一、梯度消失出现的原因：在深层网络中，如果激活函数的导数小于1，那么靠近输入层的参数的梯度因为乘了很多的小于1的数而越来越小，最终就会变为0，例如sigmoid函数，其...

2019-05-10 22:58:56 2156 1

原创 'utf-8' codec can't encode character '\udcd5' in position 177: surrogates not allowed。

练faster rcnn时报的错，最终发现是因为文件vgg16.ckpt的路径错了。

2019-05-10 11:27:27 945

原创 'No module named 'lib.utils.cython_bbox'，训练faster-rcnn python3.5版本时报错

报错的原因：python版本不匹配，好多小伙伴装Anaconda时都默认装了3.6版本的python，安装faster rcnn时会生成一个3.6版本的文件，而我们需要的是3.5版本的文件，版本不匹配，所以会报错。试了多种方法，都不可行，不如简单粗暴来的痛快些，解决方法：1 删掉Anoconda重新下载一个python3.5版本的Anaconda2 conda一个新环境我在Anacond...

2019-05-10 11:24:50 10676 10

原创深度学习面试专用：深度学习500问；文字版吴恩达深度学习，机器学习

文字版吴恩达机器学习，深度学习地址：http://www.ai-start.com/深度学习500问地址：https://github.com/fengdu78/DeepLearning-500-questions，妈妈再也不用担心知识点会有疏漏啦...

2019-05-07 22:48:43 332

原创 Sigmoid激活函数的理解（函数及其导数的图形表示，作用，优缺点）

Sigmoid函数又称logistic函数，在逻辑回归中经常出现。公式为：Sigmoid函数常被用作神经网络的阈值函数，将变量映射到0,1之间，该函数单调递增且以（0，0.5）对称，在两端变化速度较慢。它是神经网络中的激活函数，其作用就是引入非线性。优点：（1）sigmoid函数单调连续，输出范围有限，所以数据在传递的过程中不容易发散（2）由于输出范围为(0, 1)，所以可以用作输...

2019-05-07 16:26:25 13884

weixin_39853245的博客

原创 imagehash去重