笔记
文章平均质量分 60
uuup111
这个作者很懒,什么都没留下…
展开
-
如何处理数据不平衡问题
一、什么是数据不平衡问题 数据不平衡也可称作数据倾斜。在实际应用中,数据集的样本特别是分类问题上,不同标签的样本比例很可能是不均衡的。因此,如果直接使用算法训练进行分类,训练效果可能会很差。 二、如何解决数据不平衡问题 解决实际应用中数据不平衡问题可以从三个方面入手,分别是:对数据进行处理、选择合适的评估方法和使用合适的算法。 数据处理 1)过采样: 主动获取更多的比例少的样本数据。由于样本比例不均衡,在条件允许的情况下可以尝试获取占比少的类型的样本数据。(PS:这就是为什么我几乎没有遇到过..转载 2022-04-03 09:45:38 · 7667 阅读 · 0 评论 -
自监督如何训练
自监督的训练方式: 这个模型的输出会有两个,一个是对应真实标签的out,一个是对应自己设置标签的out_ss: 在训练时会有相应的两个loss: 最后需要回传的loss等于两个loss加权相加: 学习的代码来自于:原创 2021-05-18 20:17:38 · 1532 阅读 · 2 评论 -
阅读文献克服三大问题:坐不住、记不住、想不开!
阅读文献克服三大问题:坐不住、记不住、想不开! https://mp.weixin.qq.com/s/Ov2zDeoaLqenkeQnBP3GfQ原创 2020-04-09 18:02:40 · 209 阅读 · 0 评论 -
2020-03-18
输入数据有三个: edges.csv, features.csv 和 graph.csv。 这样可以保留属性信息,图结构信息等……原创 2020-03-18 21:45:36 · 113 阅读 · 0 评论