zhaosuyuan-CSDN博客

原创 token和embedding

LLM token和embedding介绍

2024-08-02 11:08:13 477

大模型训练与优化步骤：预训练、微调、对齐1. 指令微调：LoRA、QLoRA、AdaLoRa、DoRA、LoftQ、GaLore、Mixture of LoRAs、Quantization2. 对齐技术：DPO、KTO、IPO、SimPO、RLHF3. 量化技术：GPTQ、SmoothQuant、AWQ、GGUF、ZeroQuant4. 多模态技术：MoE-LLaVA、Mini-Gemini、VideoLLaMA25. 其他微调技术：Prefix Tuning、Adaptor Tuning、Flas

2024-07-23 14:05:56 168

原创 PANNs: Large-Scale Pretrained Audio Neural Networks for Audio Pattern Recognition论文总结

PANNs 音频标记、音频分类等

2024-07-15 16:01:31 573

原创行人越界检测越线越界区域多边形IOU越界判断

行人越界检测越线越界区域多边形IOU越界判断总结

2024-07-11 17:08:15 385

原创 yolo-world使用自己数据集训练

yoloworld训练自定义数据集

2024-06-26 14:27:18 1269 4

原创 X-AnyLabeling使用教程

1.AI 模型自动分割标注使用教程2.AI 模型自动目标检测标注使用教程

2024-06-24 11:45:05 745

原创 python 根据url下载图像

python 根据url下载图像。

2024-06-20 15:44:48 290

原创 scikit-image安装报错

scikit-image安装报错

2024-06-19 10:17:05 395

原创 linux下直接使用别人的anaconda环境，copy别人环境

1.直接使用别人的anaconda安装环境source /home/XXX/anaconda3/bin/activateconda activate labelme2.copy anaconda环境cp -r /home/XXX/anaconda3/envs/x-anylabeling /home/YYY/anaconda3/envsconda config --append envs_dirs /home/YYY/anaconda3/envsconda activate x-anyl

2024-05-23 17:08:12 449

原创 labelme自动标注工具的安装和python代码修改

【代码】labelme自动标注工具的安装和代码修改。

2024-03-27 17:33:20 1003

原创文生视频Sora

文生视频模型 Sora

2024-02-21 11:20:57 404

原创 Word2Vector介绍

word2vec也叫word embeddings，中文名“词向量”，google开源的一款用于词向量计算的工具，作用就是将自然语言中的字词转为计算机可以理解的稠密向量。Word2Vec是一种将文本中的词进行嵌入（Embedding）的方法，而所谓嵌入，就是将各个词使用一个定长的向量来表示，Embedding其实就是一个映射，将单词从原先所属的空间映射到新的多维空间中，也就是把原先词所在空间嵌入到一个新的空间中去。通过这种方法，我们可以获得一个词的扩展词，即与其相似的词。

2024-01-03 17:42:16 948

原创 AIGC智能创作时代一书总结

GPT-1：核心思想是将无监督学习作用于监督学习模型的预处理目标，先通过在无标签的数据上学习一个通用模型，然后根据问答和常识推理等特定自然语言处理任务微调模型，半监督学习。强化学习：强化学习并不是对数据本身学习，而是在给定的数据环境中，让智能体学习如何选择一系列行动，来达成长期累积收益最大化的目标，强化学习本质是学习一套决策系统而非数据本身。GPT-2：在语言模型领域，所有监督学习都可以看作无监督学习的子集，当模型的容量非常大且数据量足够丰富时，无监督学习的语言模型就可以覆盖所有有监督学习的任务。

2023-12-13 17:58:28 162 1

原创目标检测常用评价指标

有时这两个是矛盾的，比如只检测出了一个结果，且是正确的，那么P就是100%，但是R就会很低。ROC曲线：就是选择不同的置信度阈值，以FPR=FP/(FP+FN)，即错误预测正样本/所有预测负样本，为横坐标， TPR=TP/(TP+FN)=Recall为纵坐标。PR曲线：就是选择不同的置信度阈值，得到的不同组合的P,R，以R为横坐标，P为纵坐标绘制而成。在ROC曲线中，以FPR为x轴，TPR为y轴，FPR指实际负样本中被错误预测为正样本的概率。R低P高：识别出的飞机都是正确的，但还有很多飞机没被识别出来。

2023-11-29 13:52:16 468

原创 torch和onnx输出结果对比

torch和onnx输出结果对比

2023-11-07 20:17:38 169

原创 torch onnx 权重对比一致性

torch与onnx权重layer weight 对比是否一致。torch与onnx各层权重layer weight提取。

2023-11-07 15:42:23 128

原创 torch中输入图像是否需要提前resize对结果的影响

在实际C++代码部署中，如mxnet c++部署，如果部署时采用cv2.resize，先cv2.resize训练集再训练可以减少这种size问题导致的score敏感问题。A. 测试采用transforms.Resize((224,224))方式resize图像测试。训练采用transforms.Resize((224,224))方式resize图像训练。B. 测试采用cv2.resize(img,(224,224))方式resize图像测试。二者结果有时候差异比较大。输入尺寸对结果的影响。

2023-11-02 15:23:05 207

原创 torch mxnet c++结果对比实验

net模型和block模型数据demo，验证原图输入和resize input之后作为输入的结果比较。net和block模型过拟合，resize input影响较大。

2023-10-31 18:04:05 43

原创 torch转onnx onnx转mxnet中遇见的问题

transform.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5)) 数据标准化 (x/255-0.5)/0.5∈[-1,1]转换为mxnet数据标准化为：(x-127.5)*(1/127.5)=(x-127.5)*0.00784313725490196。通过强制将图像resize到输入大小后，torch、onnx、mxnet（python）、mxnet（c++）结果一致。原因：模型训练过拟合原因，resize方式不一样，影响波动比较大。

2023-10-31 09:46:59 101

原创模型训练优化trick

3.train loss不断下降，test loss趋于不变，过拟合：（1）正则化和降维（2）降低模型复杂度（3）获取更多数据集、数据增强。翻转，旋转，裁剪，缩放，平移，抖动、Mixup、Cutout、Cutmix、Mosaci等。4.train loss趋于不变，test loss不断下降：数据集有问题，检查数据集。6.train loss不断上升，test loss不断上升：数据清洗，超参设置不当。（7）batch size过小，loss动荡，难以收敛，过大收敛过快陷入局部最优解。

2023-07-10 11:04:33 149

原创卷积层、特征层、输出层、权重关系

卷积层、特征层、输出层、权重关系

2023-07-05 16:44:58 305

原创 torch获取每层权重

pytorch读取每层权重。

2023-07-05 11:17:07 737

原创 torch转onnx

torch转onnx。

2023-07-04 17:53:34 105

原创 git上传代码@ 代码无法查看

因为工程下除了第一级路径下的之外，project_name文件夹下出现多余的.git 文件。

2023-06-29 10:52:03 125

原创 onnx每层权重、输出层结果、简化、inference

onnx 每层权重读取，onnx每层输出结果。

2023-06-27 17:04:07 1409

原创 mxnet inference输出层output

mxnet inference输出层output。

2023-06-27 16:40:52 59

原创 mxnet inference 最后输出层结果

mxnet inference 最后输出层结果。

2023-06-27 15:36:01 55

原创 onnx mxnet输出层结果对比

onnx和mxnet转换输出层结果及其cos相似度计算对比。

2023-06-27 14:54:21 92

原创目标检测指标：IOU、P、R、Recall、ROC、AP、mAP

*Precision：**精确率，也可认为是查准率，预测的正类中对了几个TP/(TP+FP)，即正确预测正类/(正确预测正类+错误预测正类)=正确预测正类/所有预测正类样本，你猜的全部正类中，查得正确的正类的数量。**Recall：**召回率，也可认为是查全率，全部正类中你猜对了几个TP/(TP+FN)，即预测正确正类/(预测正确正类+预测错误负类)=预测正确正类/所有GT正类样本，理解成正类中召回了多少，查得多全。FN(False Negative)：预测负类，实际正类，即预测错误，和漏检率有关。

2022-12-13 17:08:07 1669 1

空空如也

空空如也