自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(57)
  • 收藏
  • 关注

原创 Seq2Seq,自回归,自编码介绍

Seq2Seq,自回归,自编码

2024-08-07 16:52:27 298

原创 yolo中可视化结果指标

yolo中可视化结果指标

2024-08-06 15:51:59 269

原创 token和embedding

LLM token和embedding介绍

2024-08-02 11:08:13 477

原创 马赛克图像处理

马赛克图像处理

2024-07-26 14:26:03 134

原创 大模型LLM技术

大模型训练与优化步骤:预训练、微调、对齐1. 指令微调:LoRA、QLoRA、AdaLoRa、DoRA、LoftQ、GaLore、Mixture of LoRAs、Quantization2. 对齐技术:DPO、KTO、IPO、SimPO、RLHF3. 量化技术:GPTQ、SmoothQuant、AWQ、GGUF、ZeroQuant4. 多模态技术:MoE-LLaVA、Mini-Gemini、VideoLLaMA25. 其他微调技术:Prefix Tuning、Adaptor Tuning、Flas

2024-07-23 14:05:56 168

原创 PANNs: Large-Scale Pretrained Audio Neural Networks for Audio Pattern Recognition论文总结

PANNs 音频标记、音频分类等

2024-07-15 16:01:31 573

原创 行人越界检测 越线 越界区域 多边形IOU越界判断

行人越界检测 越线 越界区域 多边形IOU越界判断总结

2024-07-11 17:08:15 385

原创 yolo-world使用自己数据集训练

yoloworld训练自定义数据集

2024-06-26 14:27:18 1269 4

原创 X-AnyLabeling使用教程

1.AI 模型自动分割标注使用教程2.AI 模型自动目标检测标注使用教程

2024-06-24 11:45:05 745

原创 python 根据url下载图像

python 根据url下载图像。

2024-06-20 15:44:48 290

原创 scikit-image安装报错

scikit-image安装报错

2024-06-19 10:17:05 395

原创 linux下直接使用别人的anaconda环境,copy别人环境

1.直接使用别人的anaconda安装环境source /home/XXX/anaconda3/bin/activateconda activate labelme2.copy anaconda环境cp -r /home/XXX/anaconda3/envs/x-anylabeling /home/YYY/anaconda3/envsconda config --append envs_dirs /home/YYY/anaconda3/envsconda activate x-anyl

2024-05-23 17:08:12 449

原创 labelme自动标注工具的安装和python代码修改

【代码】labelme自动标注工具的安装和代码修改。

2024-03-27 17:33:20 1003

原创 文生视频Sora

文生视频模型 Sora

2024-02-21 11:20:57 404

原创 Word2Vector介绍

word2vec也叫word embeddings,中文名“词向量”,google开源的一款用于词向量计算的工具,作用就是将自然语言中的字词转为计算机可以理解的稠密向量。Word2Vec是一种将文本中的词进行嵌入(Embedding)的方法,而所谓嵌入,就是将各个词使用一个定长的向量来表示,Embedding其实就是一个映射,将单词从原先所属的空间映射到新的多维空间中,也就是把原先词所在空间嵌入到一个新的空间中去。通过这种方法,我们可以获得一个词的扩展词,即与其相似的词。

2024-01-03 17:42:16 948

原创 AIGC智能创作时代一书总结

GPT-1:核心思想是将无监督学习作用于监督学习模型的预处理目标,先通过在无标签的数据上学习一个通用模型,然后根据问答和常识推理等特定自然语言处理任务微调模型,半监督学习。强化学习:强化学习并不是对数据本身学习,而是在给定的数据环境中,让智能体学习如何选择一系列行动,来达成长期累积收益最大化的目标,强化学习本质是学习一套决策系统而非数据本身。GPT-2:在语言模型领域,所有监督学习都可以看作无监督学习的子集,当模型的容量非常大且数据量足够丰富时,无监督学习的语言模型就可以覆盖所有有监督学习的任务。

2023-12-13 17:58:28 162 1

原创 目标检测常用评价指标

有时这两个是矛盾的,比如只检测出了一个结果,且是正确的,那么P就是100%,但是R就会很低。ROC曲线:就是选择不同的置信度阈值,以FPR=FP/(FP+FN),即错误预测正样本/所有预测负样本,为横坐标, TPR=TP/(TP+FN)=Recall为纵坐标。PR曲线:就是选择不同的置信度阈值,得到的不同组合的P,R,以R为横坐标,P为纵坐标绘制而成。在ROC曲线中,以FPR为x轴,TPR为y轴,FPR指实际负样本中被错误预测为正样本的概率。R低P高:识别出的飞机都是正确的,但还有很多飞机没被识别出来。

2023-11-29 13:52:16 468

原创 torch和onnx输出结果对比

torch和onnx输出结果对比

2023-11-07 20:17:38 169

原创 torch onnx 权重对比一致性

torch与onnx权重layer weight 对比是否一致。torch与onnx各层权重layer weight提取。

2023-11-07 15:42:23 128

原创 torch中输入图像是否需要提前resize对结果的影响

在实际C++代码部署中,如mxnet c++部署,如果部署时采用cv2.resize,先cv2.resize训练集再训练可以减少这种size问题导致的score敏感问题。A. 测试采用transforms.Resize((224,224))方式resize图像测试。训练采用transforms.Resize((224,224))方式resize图像训练。B. 测试采用cv2.resize(img,(224,224))方式resize图像测试。二者结果有时候差异比较大。输入尺寸对结果的影响。

2023-11-02 15:23:05 207

原创 torch mxnet c++结果对比实验

net模型和block模型数据demo,验证原图输入和resize input之后作为输入的结果比较。net和block模型过拟合,resize input影响较大。

2023-10-31 18:04:05 43

原创 torch转onnx onnx转mxnet中遇见的问题

transform.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5)) 数据标准化 (x/255-0.5)/0.5∈[-1,1]转换为mxnet数据标准化为:(x-127.5)*(1/127.5)=(x-127.5)*0.00784313725490196。通过强制将图像resize到输入大小后,torch、onnx、mxnet(python)、mxnet(c++)结果一致。原因:模型训练过拟合原因,resize方式不一样,影响波动比较大。

2023-10-31 09:46:59 101

原创 模型训练优化trick

3.train loss不断下降,test loss趋于不变,过拟合:(1)正则化和降维(2)降低模型复杂度 (3)获取更多数据集、数据增强。翻转,旋转,裁剪,缩放,平移,抖动、Mixup、Cutout、Cutmix、Mosaci等。4.train loss趋于不变,test loss不断下降:数据集有问题,检查数据集。6.train loss不断上升,test loss不断上升:数据清洗,超参设置不当。(7)batch size过小,loss动荡,难以收敛,过大收敛过快陷入局部最优解。

2023-07-10 11:04:33 149

原创 卷积层、特征层、输出层、权重关系

卷积层、特征层、输出层、权重关系

2023-07-05 16:44:58 305

原创 torch获取每层权重

pytorch读取每层权重。

2023-07-05 11:17:07 737

原创 torch转onnx

torch转onnx。

2023-07-04 17:53:34 105

原创 git上传代码@ 代码无法查看

因为工程下除了第一级路径下的之外,project_name文件夹下出现多余的.git 文件。

2023-06-29 10:52:03 125

原创 onnx每层权重、输出层结果、简化、inference

onnx 每层权重读取,onnx每层输出结果。

2023-06-27 17:04:07 1409

原创 mxnet inference输出层output

mxnet inference输出层output。

2023-06-27 16:40:52 59

原创 mxnet inference 最后输出层结果

mxnet inference 最后输出层结果。

2023-06-27 15:36:01 55

原创 onnx mxnet输出层结果对比

onnx和mxnet转换 输出层结果及其cos相似度计算对比。

2023-06-27 14:54:21 92

原创 目标检测指标:IOU、P、R、Recall、ROC、AP、mAP

*Precision:**精确率,也可认为是查准率,预测的正类中对了几个TP/(TP+FP),即正确预测正类/(正确预测正类+错误预测正类)=正确预测正类/所有预测正类样本,你猜的全部正类中,查得正确的正类的数量。**Recall:**召回率,也可认为是查全率,全部正类中你猜对了几个TP/(TP+FN),即预测正确正类/(预测正确正类+预测错误负类)=预测正确正类/所有GT正类样本,理解成正类中召回了多少,查得多全。FN(False Negative):预测负类,实际正类,即预测错误,和漏检率有关。

2022-12-13 17:08:07 1669 1

原创 Roberts、Prewitt、Sobel、 Laplacian边缘检测

【代码】Roberts、Prewitt、Sobel、 Laplacian边缘检测。

2022-10-29 14:03:31 834

原创 图像处理 亮度、CLAHE处理、MSRCR

图像处理 亮度 clahe处理

2022-10-11 17:58:25 915

原创 coco提取每个类别的图片数量和框bbox数量

coco提取每个类别的图片数量和框bbox数量

2022-09-06 09:52:48 443

原创 coco json文档标注可视化

coco json文档标注可视化。

2022-08-30 17:44:34 396

原创 coco标注数据格式,json文件中提取部分label

coco标注数据格式,json文件中提取部分label

2022-08-15 14:07:08 364

原创 RCNN、Fast RCNN、Faster RCNN、SPPNet对比

RCNN Fast RCNN Faster RCNN SPPNet简要比较

2022-07-07 17:38:02 808

原创 优化器optimizer,BGD、SGD、MBGD、NAG、AdaGrad、Adadelta、RMSProp、Adam

优化器根据优化点不一样可分为三类:基本的梯度下降法动量优化法自适应学习率优化法可以理解为下山过程中,选择什么方向(梯度),以速度快慢(动量),什么大小的步幅下山(学习率),才会最快达到真正的山底。基本优化法包括:批量梯度下降法BGD、随机梯度下降法SGD、小批量梯度下降法MBGD(SGD)动量优化法包括:标准动量优化法Momentum,牛顿加速度动量优化法NAG自适应学习率包括:AdaGrad、Adadelta、RMSProp、Adam算法梯度下降法最小化目标函数,利用目标函

2022-05-28 14:22:27 715

原创 OCR倾斜文字截取矫正

import osimport cv2import numpy as npimport mathfrom math import atan, fabs, sin, cosdef rotateImage(img,degree,pt1,pt2,pt3,pt4):height,width=img.shape[:2]heightNew = int(width * fabs(sin(degree)) + height * fabs(cos(degree)))widthNew = int(height

2022-05-13 17:15:18 506

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除