有用的代码
文章平均质量分 63
羊飘
要么独处,要么庸俗
展开
-
Tensor-Level替换、删除(后面元素前移)其中的元素
Tensor-Level替换、删除(后面元素前移)其中的元素.NLP中简单数据增强包括插入、删除、替换。在word级别完成的替换,比如:https://github.com/tedljw/data_augment/blob/master/eda.py但是映射到token后,在tensor级别中,我并没有找到,因此参考BERT、LevOCR的代码实现在token级别中的替换、删除。原创 2023-02-28 10:18:59 · 750 阅读 · 0 评论 -
pytorch根据labels对应位置取值 | 换一句话省两小时
pytorch根据labels对应位置取值 | 换一句话省两个小时不同语句的运行时间是存在很大差距的,特别是用for语句。在我的30W数据集上跑,在一个epoch中使用解决方法2比解决方法1 ,可以节省2个小时。一条语句,省两个小时。原创 2023-02-22 11:13:50 · 372 阅读 · 0 评论 -
pytorch Dataset类中实现样本均衡并解决AttributeError: ‘ConcatDataset‘ object has no attribute ‘get_labels‘
pytorch Dataset类中实现样本均衡并解决AttributeError: 'ConcatDataset' object has no attribute 'get_labels'原创 2023-02-12 11:59:13 · 1709 阅读 · 0 评论 -
pytorch-lightning中使用wandb实现超参数搜索
pytorch-lightning中使用wandb实现超参数搜索原创 2023-01-30 12:10:34 · 2061 阅读 · 0 评论 -
为啥需要Scaffold Split ?(附Scaffold Split代码)
在生信小分子中,通常有scaffold split和random split两种划分数据集的方式,特别是在MoleculeNet中,而基于scaffold的任务要比random split的任务更难,而且更有意义。scaffold split代码。原创 2022-11-22 16:38:03 · 2109 阅读 · 0 评论