Yu十三-CSDN博客

原创 Mac vscode配置SSH免密登陆

MAC端Vscode配置SSH免密登陆

2022-11-25 14:44:52 2813

原创 IOS XCode Objectc SHA256加密

ios端在XCode中基于ObjectC语言进行SHA256编码

2022-11-22 14:38:45 1392

原创解决onnxruntime警告问题

解决onnxruntime警告问题

2022-11-01 11:34:17 4762 4

原创 ONNX模型转换成NCNN模型

ONNX模型转换NCNN模型过程总结

2022-10-20 10:27:19 7533 3

原创 Vscode远程连接服务器debug没反应

vscode连接远程服务器无法debug问题分析

2022-09-23 11:55:48 1850

网格搜索：在所有候选的参数选择中，通过循环遍历，尝试每一种可能性，表现最好的参数就是最终的结果。贝叶斯优化：贝叶斯优化其实就是在函数方程不知的情况下根据已有的采样点预估函数最大值的一个算法。该算法假设函数符合高斯过程（GP）随机搜索：已经发现，简单地对参数设置固定次数的随机搜索，比在穷举搜索中的高维空间更有效。这是因为事实证明，一些超参数不通过特征变换的方式把低维空间转换到高维空间，而在低维空间不可分的数据，到高维空间中线性可分的几率会高一些。具体方法：核函数，如高斯核、多项式核等等。基于梯度：计算.

2021-06-03 09:27:57 663

原创 Batch Normalization简单理解

使用BN的原因是网络训练中每一层不断改变的参数会导致后续每一层不断的分布式变化，而学习的过程又要使每一层去适应输入的分布，因此不得不降低网络的学习率，并且要小心使用初始化（internal covariant shift）如果仅通过归一化方法使得数据具有零均值和单位方差，则会降低层的表达能力（如果使用Sigmoid函数，只使用线性区域）BN的具体过程（注意第三个公式中分母要加上epsilon）注意点：在测试过程中使用的均值和方差已经不是某一个batch的了，而是针对整个数据集而言。因..

2021-04-14 09:48:29 263

原创 Fast RCNN中位置损失为何使用Smooth L1

Smooth L1的表达式为SmoothL1(x)={0.5x2,if ∣x∣ < 1∣x∣−0.5,otherwiseSmooth_{L_1(x)}=\begin{cases} 0.5x^2, & \text {if $|x|$ < 1} \\ |x|-0.5, & \text{otherwise} \end{cases} SmoothL1(x)={0.5x2,∣x∣−0.5,if ∣x∣ < 1other

2021-04-14 09:33:33 276

原创反卷积（转置卷积）的实质

一般的卷积运算可以看成是一个其中非零元素为权重的稀疏矩阵C与输入的图像进行卷积相乘，反向传播时的运算实质为C的转置与loss对输出y的倒数矩阵的矩阵相乘。逆卷积的运算过程与卷积正好相反，是正向传播时左乘C的转置，反向传播时左乘C。...

2021-04-14 09:22:23 188

原创 Xception,ResNeXt,ShuffleNet对比

ResNeXt中，作者提到cardinality的概念，表示对通道进行分组。Xception中，卷积对每个通道进行单独计算，也就是cardinality等于通道数，如果有N维通道输出，那么cardinality就等于N（depth-wish separable convolution）group convolution的优点：卷积操作把所有的通道信息考虑在内，可能是一种信息的浪费，卷积参数有限，产生的结构难免会有一定相关性，有可能造成过拟合（类似于全卷积层）ShuffleNet就对group con.

2021-04-14 09:15:13 355

原创为什么SSD对小目标检测效果不好

小目标对应anchor较少，其对应的feature map 上的pixel难以得到训练，这也是为什么SSD在augmentation之后精确度上涨（因为crop之后小目标就变为大目标）要检测小目标需要足够大的feature map来提供精确特征，同时也需要足够的语义信息与背景作区分。...

2021-04-14 09:08:56 1158

原创维数灾难

高维空间训练得到的分类器相当于低维空间的一个复杂非线性分类器，这类分类器容易产生过拟合。如果一直增加维度，原有的数据样本会越来越稀疏，要避免过拟合就需要不断增加样本。数据的稀疏性使得数据的分布在空间上是不同的，在高维空间中心比边缘区域具有更大的稀疏性（举例，正方体和内切圆到超立方体和超球面，随着维度趋于无穷，超球面体积趋向于0而超立方体体积永远是1）...

2021-04-14 08:49:57 225

原创 Dropout的原理

可以把dropout看成是一种ensemble方法，每次做完dropout相当于从原网络中找到一个更瘦的网络。强迫神经元和其他随机挑选出来的神经元工作，减弱了神经元节点间的联合适应性，增强泛化能力。使用Dropout得到更多的局部簇，同等数据下，簇变多了，因而区分性变大，稀疏性也更大。...

2021-04-14 08:42:57 370

原创数据集类别不平衡问题怎么解决的？

欠采样（假设数据集中反例占多，去除一些反例，使正反例数目接近）过采样（假设数据集中反例占多，对正样本进行过采样，增加一些正例）阈值移动（基于原始训练集进行学习，但在用训练好的分类器预测时，将缩放的公式嵌入到过程中）...

2021-04-14 08:34:55 586

原创 Fast-RCNN的区域候选框是怎么得到的？

通过Selective search得到的，先基于图像分割得到小尺寸区域，再一次次合并成尺寸。（一共会选2w多个框）

2021-04-14 08:27:47 616

原创图像特征金子塔的作用？怎么实现的？

作用：为了解决多尺度检测问题，引入了FPN。实现：先将图像下采样，然后再上采样做特征图融合，融合过程中不同尺度的特征图进行预测。

2021-04-14 08:21:48 226

原创目标框常见的损失有哪些变形

IOU当目标越接近真实目标时，则IOU越接近1，则loss越小。这样模型就可以通过不断降低loss来使得模型得出更好的预测结果。缺点：两框不相交时，可能需要多次迭代才会出现交集，可能出现loss不变的情况。当三个框重合差不多的时候，相交面积一样时加入中心点距离更加合理GIOU损失在IOU损失的基础上增加了∣A−U∣A\frac{|A-U|}{A}A∣A−U∣的惩罚项，解决了两框不相交loss恒为0的情况。两框越远loss越大。DIOU，直接采用两框中心点的距离作为惩罚，loss下降的更快。CIOU.

2021-04-13 10:30:17 248

原创 Yolo路由层的作用是什么？

融合特征开辟一个新的检测分支

2021-04-13 10:24:50 375

原创空洞卷积的优点

pooling操作虽然能增大感受野，但是会丢失一些信息。空洞卷积在卷积核中插入权重为0的值，因此每次卷积中会skip掉一些像素点空洞卷积增大了卷积输出每个点的感受野，并且不会像pooling那样丢失信息，在图像需要全局信息或者较长sequence依赖的语音序列问题上有着较为广泛的应用...

2021-04-13 10:24:09 784

原创介绍伪标签技术

将test数据集中的数据加入到train数据中，其对应的标签为基于原有数据集训练好的模型预测得到的。伪标签技术在一定程度上起到一种正则化的作用。如果训练集开始就使用该技术，则网络可能存在过拟合的风险。但是如果经过一些epoch之后再使用该技术（只是使用原有训练集数据）将训练集和未打标签的数据一起训练，则会提升网络的泛化能力。操着过程中一般每个batch的1/4到1/3为伪标签数据。...

2021-04-13 10:21:54 719

原创介绍常见的Loss损失函数

假设有m个数据输入X:x1,x2...xmX:x^1,x^2...x^mX:x1,x2...xm模型预测值为Y:y1,y2...ymY:y^1,y^2...y^mY:y1,y2...ym模型真实值为Y^:y^1,y^2...y^m\hat{Y}:\hat{y}^1,\hat{y}^2...\hat{y}^mY^:y^1,y^2...y^mSSE(和方差)SSE(Y,Y^)=∑i=1m(y^i−yi)2SSE(Y,\hat{Y})=\sum_{i=1}^{m}(\hat{y}_i -y_i)^2

2021-04-13 10:16:32 1248

原创 mAP的计算公式是什么？

想要计算map首先要知道下面几个公式：精确度Precision=TPTP+FPPrecision=\frac{TP}{TP+FP} Precision=TP+FPTP召回率Recall=TPTP+FNRecall=\frac{TP}{TP+FN} Recall=TP+FNTP其中TP是正类判定为正类、FP是负类判定为正类、FN是正类判定为负类、TN是负类判定为负类在Precision-Recall曲线基础上，通过计算每个recall值对应的Precision值得平均，可以获得一个数组形式的评

2021-04-13 09:43:49 19985 2

原创 LSTM相较于RNN的优势有什么？

LSTM结构更为复杂，在RNN中，将过去对的输出和当前的输入concat到一起，通过tanh来控制二者对的输出，只考虑最近时刻的状态。而在LSTM中为了能记住长期的状态，增加了一条路上输出和一路输入。LSTM使为了解决RNN中梯度消失问题所提出的，LSTM只能必变RNN的梯度小时（gradient vanishing），但是不能对抗梯度爆炸（exploding gradient）...

2021-04-13 09:23:14 4238 1

原创介绍Focal loss和变体

Focal loss公式：FL(pt)=−(1−pt)γlog(pt)FL(p_t)=-(1-p_t)^γlog(p_t)FL(pt)=−(1−pt)γlog(pt) Focal loss是为了解决one-stage目标检测中正负样本不均衡、难易样本严重失衡的问题所提出的。在原有的交叉熵loss的基础上增加了一个预测概率ptp_tpt和超参数γγγ.Focal loss举例说明当γγγ=0时，focal loss等于标准交叉熵函数。当γγγ> 0时，因为(1−pt)(1-p_t)(1

2021-04-13 09:20:32 1053

原创 BN的参数如何优化

首先BN在pytorch中是继承nn.Module类的，有一个属性training指定是否是训练状态，训练状态与否会影响某些层的参数是否固定（对于BN层测试的均值和方差是通过统计训练的时候所有的batch的均值和方差的平均）或者Dropout层（在测试的时候所有神经元都是激活的）。通常用model.train()指定当前模型为训练状态，model.eval()指定当前模型为测试状态。同时，BN中有几个参数需要比较关心的，一个是affine指定是否需要仿射，还有一个是track_running_stats.

2021-04-13 09:00:33 702

转载 Maxpooling层如何梯度回传？

传给之前最大的像素，其他是0 Max pooling也要满足梯度之和不变的原则，Max pooling的前向传播是把patch中最大的值传给下一层，其他的像素则被舍弃掉。而Max pooling的反向传播就是把梯度直接传递给前一层某一个像素，而其他像素点不接受梯度。注：Max pooling需要记录下池化操作时到底哪儿个像素点的值最大，在反向传播时候赋予其值。...

2021-04-13 08:46:13 2024

原创如何解决数据集的正负样本不平衡问题？

解决这一问题的基本思路就是让正负样本在训练过程中拥有相同的话语权，比如利用采样、加权等方法。采样；采样分为上采样和下采样，上采样是把小众类复制多份，下采样是从大众类中剔除一些样本或者说只从大众类中选取部分样本。数据合成；利用已有的样本生成更多样本，这类方法在小数据场景中有很多成功的案例。加权；不同类别分错的代价不同。一分类；对于有正负样本极其不平衡的场景，我们可以换一个角度来考虑问题，把他堪称一分类或者异常检测问题。这类方法的重点不在于捕捉类间的差别，而是为其中一类进行建模，经典的工作包括One-

2021-04-12 10:26:33 1823

空空如也

空空如也