解决MemoryError 问题的尝试方案

背景:在做nlp任务前期,尝试各种常用baseline方法的效果,然后用fix_transform加载数据时,报错MemoryError。请教了相关同事以及网上的解决方案,查到了最根本的方法:换个内存大的机器,然而我的瓶颈就是没有机器~

所以从自己的特征入手,改变原来的特征拼接方法,用内积、累加等方式尝试,结果。。。

所以决定从更上层来尝试——减少提取特征时的维度:
1.将在样本层做处理,将多个文本合并,从而源头上成倍减少特征维度
2.在文本不变的基础上,减低单个文本维度

后续跟进:
对于第一种方式,将特征大小减少到原来的2/3,初步auc效果87%,目前看可以进一步优化

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值