谈下关于kaggle的反作弊规则

本文深入探讨Kaggle平台的反作弊机制,包括账号管理规定、提交策略及后果,揭示如何避免被视为作弊行为,如使用小号、提交频率限制及反作弊系统的运行时间等关键信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

看了下知乎,反作弊机制无视账号所在不同的IP

如果两个账号的提交文件一模一样,并且没有线上组队,那么就会取消成绩。多次取消成绩封号处理。kaggle官方不接受申诉。

开小号组队的话,整个队伍同样只有五次/天。

另外可以开小号提交不同的模型的效果。

如果多个账号提交别人公开的kernel上面的结果会不会被查呢?应该是不会的。

删号如果开了新号以后,你新提交的和删号前提交的一致,就会被视为作弊,我在这里找到了一个有意思的截图:

如果A账号和B账号曾经(注意是曾经)提交过相同的结果,最后结果不一致,会不会被查呢?不清楚

删号的还有一个效果如下:

如果作弊了,删除账号有没有用呢?

我之前注册了两个号码,一个账号没包含名字想改,改不了,然后去注册了第二个账号,

然后第二个账号就被封了,发邮件给kaggle要求删除第一个才能恢复第二个。

然后就删除了第一个。

然后第一个过几天就彻底连discussion上面的信息都没了。

今天删了一次主号,然后重新注册,没问题,所以还有一种办法是,你注册一个小号,五次上限达到了以后,你可以删除这个号然后重新建,提交新的结果,那么这样理论上你就可以在一天内提交无数次。

但是删号会同时删除你之前其他比赛的所有成绩

另外,kaggle的GPU只让用30个小时,所以从媷羊毛角度,小号也是必须的。

小号还有一个作用就是别人发布了kernel 但是没有提交成绩,那么你可以用小号测试下对方的kernel的submission.csv

另外,提交次数的话是根据账户所在ip的时区来更新的,国内的话,是第二天八点准时更新。

有个自称京东的哥们儿作弊直接导致成绩被取消:

这个人发的notebook是:

IEEE cbt 9600 LB solution | Kaggle

一个小技巧,如果是用临时邮箱注册的小号,那么看过的帖子有更新,怎么知道哪些更新的评论是自己没看过的呢?

很简单,在之前看的时候,给评论点赞,这样点赞过的都会有标记,过几天再来看这个帖子,没点赞过得就是没看过的.

如下:

另外,反作弊系统大概运行时间为不到一天.在通过作弊系统以后,才会发放奖牌.

补充:

作弊被kaggle发现后,你的submission.csv 全部会消失。

如果是因为没有上传代码文件(Two-stage 比赛)被取消成绩,那么submission记录将会保留,呈现:

上面这个是正常的。

下面的这个是作弊处理结果

账号正常的话应该是这样:

也就是说,被查到作弊后,你提交的文件被kaggle吞没作为凭据,按钮"My Submissions消失"你再也不能参加这个比赛了。

另外,还有的人通过两个文件各自乘以一个不同系数来防止"被kaggle认为作弊",注意这个系数不能是这种1.000001

因为小数点后面位数太多的话,两个文件就是一样的了,因为kaggle是计算小数点后面的4~5位,所以

如果你的位数太多,两个文件一致,就会被认为是作弊的了。

举个例子:

帐号a:预测文件predict1.csv=原始文件*1.00001

帐号b:预测文件predict2.csv=原始文件*1.00002

两个帐号分别提交上述结果到同一场比赛,

属于结果一致,会在比赛结束后,两个帐号都会被视为作弊,因为反作弊系统只看前面几位小数.

kaggle具体检测前几位小数?每场比赛检测的小数位数长度各不相同。

一定要记住,如果你开了小号,或者小号借给别人用了,任意两个账号之间的某次提交都不能是同一个文件,如果你乘了一个系数1.000001生成一个文件,kaggle会认为生成后的文件与生成前的一致,视为作弊,两个账号都会有作弊记录,作弊的效果上面的截图中有.被视为作弊后,kaggle禁止申诉,一定要小心,最好是每次提交的时候,都做个记录,严格检查与上次提交的结果不一致。个人比较推荐的习惯就是,每个csv文件只要你修改过,就重命名,并且每次提交文件到kaggle之前,都确定自己提交的是个新名字的文件。

同一个IP登陆多个不同的kaggle账号会不会被判定为作弊呢?

理论上来讲,不会。

①因为一个IP,室内可以团队的各个成员独立参加,他们在百度上的IP都是路由器IP

②IP是动态的,DHCP决定的,也就是每次你启动电脑、打开百度的IP都可以与上一次不一样。所以换位思考,kaggle官方不可能通过绑定"IP和账号"的方式,来判定同一个IP登陆的都是作弊成员。

同一台电脑多个账号提交不同的csv会不会被判定为作弊呢?

理论上来讲,不会。

因为Kaggle没有PC客户端软件,都是网页登陆,理论上来讲,浏览器不会提供你网卡的物理地址给kaggle。不像QQ这种客户端把个人电脑信息扫描个遍。

为什么两个文件里面的数值很接近不会被判定为作弊呢?

因为kaggle的排行榜基本都是在拼小数点后面几位,前几百名成绩都差不多,所以kaggle没法监测这种情况,如果kaggle想要监测,那么kaggle就必须冤枉和错杀排行榜前面做的特别好的一些参赛选手。

注意Two-Stage比赛会同时查stage1和stage2的作弊情况

评论 33
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值