macan_dct-CSDN博客

原创干货！解决MindIE部署的DeepSeek-V3.2-Exp-W8A8不支持function call问题

MindIE下的atb-model源码库（修正function call），改正后，可支持流式和非流式推理

2025-11-07 10:56:04 1704

原创 MindIE部署DeepSeek-V3.2-Exp

使用MindIE部署DeepSeek-V3.2-Exp，完整、详细。

2025-11-04 11:29:13 1865

原创最全、最清晰的国内标志牌分类数据集

该数据来源于开源标志牌数据集、自车行车记录仪采集的标志牌、开源自驾数据集中的标志牌，经过自己的目标检测模型和分类模型不断地训练、标注轮回，整理出了这份数据集，一共有392个类，其中训练集共有310536张，验证集有78342张，每一张都是来源于真实场景下的标志牌，而不是使用数据增强方法得到的。

2025-10-15 20:54:25 431

请注意，本文只是总结、归纳、整理LLM加速相关组件，并不会对这些组件进行详细的解释。在软件层面，生成器（LLM）是自回归的，在decode阶段，每次只生成下一个token，所以生成器在每次迭代时都要处理增量式的token。例如，你要使用10个token的prompt去生成100个token，并不意味着仅仅使用109个token去迭代，而是10+11+12+13+…+109=5950个token。所有的token都要和所有的token做内积，导致N²的复杂度。

2025-10-14 11:41:34 1180

原创 pycharm使用ssh连接服务器（ubuntu）跑代码报错：“sudo+ssh: ……bash: line 0: cd: xxx/code: No such file or directory”

pycharm使用ssh连接服务器（ubuntu）跑代码报错：“sudo+ssh: ……bash: line 0: cd: xxx/code: No such file or directory”sudo+ssh://xxx@xxx/anaconda3/envs/py36/bin/python -u “xxx/code/main.py”bash: line 0: cd: xxx/code: No such file or directorySudoPasswordPrompt655neudrfcn7s

2022-02-18 13:37:00 1582

原创 Batch Normalization详解（原理+实验分析）

Batch Normalization详解（原理+实验分析）1. 计算过程2. 前向传播过程3. 反向传播过程4. 实验分析4.1 实验一：验证有没有BatchNorm下准确率的区别4.2 实验二：验证有没有BatchNorm+noisy下准确率的区别4.3 实验三：验证有没有BatchNorm+noisy下准确率的区别4.4 实验小结5. BatchNorm的其他细节5.1 训练和推理阶段时参数的初始化问题5.2 BatchNorm在哪个位置最好？5.3 在训练时为什么不直接使用整个训练集的均值/方差？5

2022-02-10 14:11:12 11846 10

原创 BatchNorm怎样解决训练和推理时batch size 不同的问题？

BatchNorm怎样解决训练和推理时batch size 不同的问题？BatchNorm是在batch维度上计算每个相同通道上的均值和方差，通常情况下，训练阶段的batchsize较大，而推理时batchsize基本为1。这样的话，就会导致训练和推理阶段得到不同的标准化，均值和方差时靠每一个mini-batch的统计得到的，因为推理时只有一个样本，在只有1个向量的数据组上进行标准化后，成了一个全0向量，导致模型出现BUG。为了解决这个问题，不改变训练时的BatchNorm计算方式，仅仅改变推理时计算均值

2022-02-10 11:35:07 4364

原创 Batch Normalization的反向传播解说

Batch Normalization的反向传播详细解说Batch Normalization在我的另一篇博客中已经详细说明了，而这篇我将详细介绍下Batch Normalization的反向传播的细节。先贴张前向和反向传播图：从左到右，沿着黑色箭头向前传播。输入是一个矩阵X，γ\gammaγ和β\betaβ作为向量。从右到左，沿着红色箭头反向传播，将梯度从上一层分布到γ\gammaγ和β\betaβ，并一直返回到输入。篇外话，下图中简单说明了正向传播和反向传播的示意图，如果看不懂，建议百度搜索链

2022-02-10 11:10:14 2469 1

原创 LINUX暂停、挂起进程，开启进程

LINUX暂停、挂起进程，开启进程先使用如下命令查看你需要暂停的进程：ps -a确定想要关闭的进程后，使用如下命令暂停、挂起进程：kill -stop 进程号如果你想开启上面挂起的进行，并放在后台运行：kill -cont 进程号...

2022-02-08 10:22:16 4558

原创使用pytorch搭建卷积神经网络的一般写法

使用pytorch搭建卷积神经网络的一般写法（Alexnet为例）前言数据集代码1. 定义自己的transform2. 定义自己的Dataset2. 定义自己的DataLoader3. 设置GPU还是CPU运行设备4. 加载模型5. 设置优化器6. 定义损失函数7. 开始训练+验证整体代码前言本文使用pytorch简单搭建了一个Alexnet，代码流程可以作为模板，按照这个流程就可以写自己的训练代码了。数据集数据集使用的17flowers，一共有17个类别的花，做图片分类任务。17flowers数据

2022-01-22 17:45:41 2142 3

原创 pytorch的padding怎么使用？支持哪些padding方式方法？padding有什么意义？

pytorch的padding怎么使用？支持哪些padding方式方法？padding有什么意义？前言pytorch支持哪些padding？1. zeros（常量填充）2. reflect（反射填充）3. replicate（复制填充）4. circular（循环填充）总结前言搭建深度学习模型，必不可少使用卷积，卷积中有一个参数padding需要理解且应该掌握选择哪种方式进行padding，本文对pytorch中支持的四种padding进行详细描述。torch.nn.Conv2d(in_channel

2022-01-17 18:24:10 20317 1

原创 pytorch的Conv2d参数详解

pytorch的Conv2d参数详解torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode='zeros', device=None, dtype=None)in_channels：输入维度，即你上一层特征图或者原始图片（3）的通道数out_channels：你希望这一层输出多少层的特征图，或者说你希望有多少个

2022-01-17 16:40:03 3194 2

原创使用conda和pip批量安装Python包

使用conda和pip批量安装Python包1. conda方式批量安装2. pip方式批量安装在debug Yolov5之前，需要按照其txt文件中指定的包的版本来指定安装工程需要的Python包，截图如下：（这里面的torch慎装，因为这种方式装的pytorch不吃吃GPU，如果某个包不想安装，只要在该行前面输入注释符就行）1. conda方式批量安装进入(cd)到txt文件所在文件夹路径下，运行以下命令：$ conda install --file=requirements_conda.t

2022-01-12 11:24:23 3731

原创使用tengine部署模型时，编译报错：fatal error: NvInfer.h: No such file or directory | #include ＜NvInfer.h＞

使用tengine部署模型时，编译报错：fatal error: NvInfer.h: No such file or directory | #include 很明显，就是缺少头文件，这个头文件是自己配置tengine部署环境中需要安装的TensorRT带的头文件，（有关在Ubuntu系统上配置TensorRT的相关内容，详见我的另一篇博客：Ubuntu18配置CUDA10.2 cudnn8.0.1 TensorRT7.1.3.4）那么就需要在编译部署代码的CMakeList.txt中指定这个头文件的路径

2022-01-11 11:00:05 2140 4

原创 Ubuntu18升级 cmake

Ubuntu18升级 cmake话不多说，直接输入下面命令，具体版本需要自己手动更改地址。$ wget https://cmake.org/files/v3.18/cmake-3.18.0.tar.gz$ mv cmake-3.18.0.tar.gz /usr/local/$ cd /usr/local/$ tar xf cmake-3.18.0.tar.gz$ rm -rf cmake-3.18.0.tar.gz$ cd cmake-3.18.0/$ sudo ./configure$

2022-01-11 10:48:41 730

原创 Ubuntu18配置CUDA10.2 cudnn8.0.1 TensorRT7.1.3.4

来自实际项目，项目简述：自动驾驶测试阶段，需要在车端测试算法运行在一个带有2080Ti工控机，这里使用tengine来部署模型。由于项目保密原因，本文不使用实际本团队开发的算法，就仅仅使用tengine自带的demo，完全够用。

2022-01-11 10:11:00 1435

原创在tengine平台使用TensorRT运行目标检测算法

使用开源的tengine在GPU上使用TensorRT运行目标检测模型

2022-01-11 10:08:17 2237 1

原创 Ubuntu18配置CUDA10.2 cudnn8.0.1（cuda_10.2.run格式+cudnn-10.2-linux-x64-v8.0.1.13.tgz格式）

Ubuntu18配置CUDA10.2 cudnn8.0.1（cuda_10.2.run格式+cudnn-10.2-linux-x64-v8.0.1.13.tgz格式）

2022-01-11 09:38:30 1328

原创 pandas时间序列相减，找出时间最接近的

两张表如下：表1：表2：需求：按照表1的“用户唯一ID”，在表2 中找到对应的“客户风险等级”和“评估日期”难点：每个“用户唯一ID”对对应不同“评估日期”日期下的“客户风险等级”，所以不能简单的使用pd.merge()解决方法：双层循环，找到时间差小的“评估日期”作为当前用户的“客户风险等级”，同时为了体现是最近的信息，必须保证# 客户风险表## 因为每个用户在不同时期会有不同的风险等级，所以这里需要一个一个迭代，去匹配与当前交易日期最接近的评估日期下的风险等级custom_ri

2021-12-16 13:04:38 2120

原创目标检测RCNN系列的候选区选择算法——selective search（原理+Python实现）

一直想总结下目标检测的一系列算法，分为两个主要路线，一个是从RCNN发展起来的两阶段算法，另一个是以YOLO发展的一阶段算法。本篇属于RCNN算法中重要的一部分，用来解决生成候选区域的问题，算是基础，也很重要，尽管该算法已经过时了，但是掌握其中的思想用来解决可以问题还是不错的。简述作用：在原图片上，以尽可能快和好地生成可能包含目标的候选块。换句话说，避免了穷举法的计算量大且无图像本身信息的缺点。解决办法（大致思想）：selective search首先使用 Felzenswalb图像分割算法将图像

2021-12-14 21:56:21 5246 1

原创 ModuleNotFoundError: No module named ‘tensorflow.compat.v1‘

报错信息如下：很明显，tflearn和TensorFlow的版本不匹配，看了这篇博客之后才发现这两个的对应关系是：TensorFlow：1.12.0tflearn：0.3.2使用pip install tflearn==0.3.2解决

2021-12-14 17:13:40 4586

原创 c++的OpenCV中imread和cvLoadImage的区别

imread和cvLoadImage都可以实现读图片的功能，但是其使用场景不同。总地来说：imread是C++接口，而cvLoadImage是c接口，所以针对不同平台可以选用适当接口imread是在highgui.hpp中定义的，cvLoadImage是在highgui_c.h中定义的，而这两个头文件都在highgui.h中include的了，如下图。所以只需要在你的项目中#include "highgui.h"就好返回的数据类型不同，imread返回cv::Mat，cvLoadImage返回的是

2021-12-14 09:35:26 7849

原创 C++的OpenCV函数 cvReleaseImage

cvReleaseImage表面理解就是释放读取的图片的内存，对应读图片使用的是cvLoadImage。使用cvReleaseImage后，会设置此时图片占用的内存数据为NULL，但是该内存地址不会被释放，当有新图片使用cvLoadImage读时，会放在这个被置位NULL的内存地址处，详情如下：#include "highgui.h"#include "OCV.h"void openCV::debugcvReleaseImage(char imgPath[100]) { if (imgPath

2021-12-14 08:59:12 2920

原创数据挖掘常用套路总结

数据挖掘常用套路总结前言一、特征抽取二、特征选择1、删除那些特征值相同的特征2、选择最佳特征功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程...

2021-12-09 16:42:53 400

原创数据挖掘项目——新零售无人智能售货机商务数据分析

数据挖掘项目——新零售无人智能售货机商务数据分析一、原始数据分析二、数据清洗1、处理附件12、处理附件2三、数据分析1、描述性分析2、数据可视化结果如下：一、原始数据分析原数据中包含两个附件annex_1和annex_2。其中annex_1中有数据：订单号、设备ID、应付金额、实际金额、商品、支付时间、地点、状态、提现。具体如下：#原始数据detail = pd.read_csv('...

2021-12-09 16:41:51 7728 8

原创使用numpy将大数组存以TXT格式储到记事本中

有时候某个数组特别大，使用编译器不容看出每个像素的分布情况，这时候就可以将该数组完整的存到一个TXT中，在TXT中仔细观察。img2 = Image.open("G:/Program/HUAWEICloud/data/train/labels/382_7_33.png")i = np.asarray(img2)np.savetxt('iii', i, fmt='%s', delimiter=' ')...

2021-12-09 16:40:48 563

原创 tensorflow报错：ModuleNotFoundError: No module named ‘numpy.core._multiarray_umath‘ ImportError: numpy.

tensorflow报错：ModuleNotFoundError: No module named 'numpy.core._multiarray_umath' ImportError: numpy.core.multiarray failed to import现象：原因：NumPy版本和当前Tensorflow版本不兼容解决方法：pip install --upgrade numpy结果：完美解决...

2021-11-23 15:44:58 1469

原创在jupyter notebook中使用自己创建的python虚拟环境

方法步骤如下：启动命令行界面创建虚拟环境：conda create -n name python=3.6启动要在jupyter notebook中使用的python环境： activate name安装jpykernel： conda install ipykernel安装nb_conda：conda install nb_conda进入到项目路径下，输入：jupyter notebook如下图，在"new"下选择想要的虚拟环境，完事...

2020-12-04 15:54:43 1908 1

原创大数据开发面试总结

大数据开发面试总结上海合合实习面试一面（电话died）1、熟悉那些java的list集合2、ArrayList和LinkedList的区别？3、JVM的内存4、类的加载过程5、python的闭包、魔术方法、__new__、高阶方法6、java的list集合7、java的string为什么是不可变的？8、java的回收器G19、有没有调试过spark的源码10、静态代码块和静态方法哪个先执行11、静态方法能否调用非静态方法11、方法重载和方法重写12、设计模式13、hive的窗口函数14、hadoop运行时，

2020-07-28 19:37:43 560

空空如也

空空如也