学习记录
记录每日工作细节,方便日后复盘。
小小码龙
种一棵树最好的时间,一是十年前,二是现在。
展开
-
RongBYReport-20220530
日报-0523今日主要工作是对新想法的代码进行编写,即使用样本在邻居样本的投影值来体现样本的相对坐标,并以此作为损失函数,训练模型。但实验效果好像欠佳,不怎么好,下面附实验与代码截图,今日主要工作还包括训练模型、调参。实验过程:代码截图:...原创 2022-05-23 23:03:17 · 157 阅读 · 0 评论 -
Smote学习笔记
Smote的定义SMOTE是一种综合采样人工合成数据算法,用于解决数据类别不平衡问题。它以每个样本点的k个最近邻样本点为依据,随机的选择N个邻近点进行差值乘上一个[0,1]范围的阈值,从而达到合成数据的目的。这种算法的核心是:特征空间上邻近的点其特征都是相似的。它并不是在数据空间上进行采样,而是在特征空间中进行采样,所以它的准确率会高于传统的采样方式。即在以上所选的两个少数类样本中线性插值,生成新样本,明日考虑更新阅读smote实现的代码,并应用于LDL。参考文献 [1] Chawla, N. V原创 2022-05-16 22:29:40 · 990 阅读 · 2 评论 -
RongBYReport-20220414
日报-0412今日主要工作是改进了两幅图,用于描述新Idea的整个思想,同时开展实验。原创 2022-04-14 21:51:18 · 339 阅读 · 0 评论 -
RongBYReport-20220412
论文修改由于实验的不断修改,因此无法撰写实验部分的内容,因此只写了初步的摘要轮廓,还未完善,后续将贴出。原创 2022-04-12 21:12:24 · 269 阅读 · 0 评论 -
RongBYReport-20220411
日报-0411今日主要工作记录如下:实验记录在进行Heat等小维度标签数据集进行实验时,发现其效果很差,因此通过分析结果得出初步结论:由于标签分布的维度较小,所含信息较少,添加的随机噪声的影响较大,因此生成的数据很大程度上可能取决于输入的噪声。因此,为了避免噪声对生成数据产生较大的影响,在Gan生成预测其特征向量时,通过取三次预测的平均值来作为特征向量,避免由于噪声的随机性导致Gan去学习到无用信息。以下为旧的实验流程图与现在实验流程图。由于对一个数据集进行一次完整的五折交叉验证实验需要4原创 2022-04-11 20:22:09 · 215 阅读 · 0 评论 -
RongBYReport-20220410
日报-0409今日主要工作记录如下:基于之前的实验继续深入对于Gan训练的损失曲线进行分析后,最终确定了判别器D的学习率为0.002,生成器的学习率为0.001,训练过程相对稳定,并在Alpha数据集上进行了多轮实验,并将其欧式距离下的测试结果记录如下:在Alpha数据集上的结果提升只有0.00001,效果微乎其微,但是在Heat数据集上的效果却倒退了0.0005左右,说明生成的数据问题较大,等待解决。...原创 2022-04-10 20:57:44 · 357 阅读 · 0 评论 -
RongBYReport-20220408
工作总结-0408调整Gan网络的训练方式LDL数据不像传统图像数据一样,可以轻松地可视化。因此为了提取“最优”的Gan网络,需要制定特殊的Gan网络“早停”方案,以下对其结果进行记录。验证集误差阈值限制法即将每轮Gan网络都保存下来,并在验证集上进行样本生成;此处使用验证集的标签分布来生成对应的样本特征,当生成的样本特征与真实样本特征相差小于一定阈值时保存该模型,最后测试时使用最后一次保存的模型。其中Gan训练的细节为:判别器D的学习率为0.01, 生成器G的学习率为0.001,轮数都原创 2022-04-08 20:27:18 · 224 阅读 · 0 评论