- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 处理文本分类中样本不均衡的问题
一个文本二分类的项目中遇到了严重的数据倾斜(data skew),想到两种解决的思路: (1) 仿照数据增强,打乱词序增加正样本数量,以及样本直接复制扩充(增加loss中的影响,但也会影响到train集中的准确率) ;(2) 设计一个新的loss函数,增加对少样本的损失占比。 发现大神们已经有成熟的研究,copy一下:...
2018-05-11 15:19:13 9264
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人