1 引言
随着读论文和做实验的增多,我发现了sci的很多猫腻经不起细细推敲,原来科研并不如我想象的神圣,还不如工业界来的实在,因为在工业界做项目出现问题,客户是验收不了不给付钱的。所以论文只是一个玩具。
2 常见的科研怪象
2.1 训练集充当测试集
这是一个非常严重的问题。按照科学的方法论,训练集和测试集应当是完全分开的,以便于评估模型的泛化能力。然而,有些研究为了提高自己的模型在某些指标上的表现,却使用训练集来测试,这相当于作弊。这种行为不仅违背了科学的原则,也使得模型的真实性能无法得到验证。
2.2 源码不公开或不可运行
开源是推动科研进步的重要力量,它可以促进知识的共享和交流,也可以方便后来者复现和改进模型。但是,有些研究者出于各种原因(如学术压力或商业考虑或者大家都懂。。。)不愿意公开源码。更糟糕的是,有些公开的源码由于缺少必要的文件或说明,无法运行,给后来者带来极大困扰。