看了下知乎,反作弊机制无视账号所在不同的IP
如果两个账号的提交文件一模一样,并且没有线上组队,那么就会取消成绩。多次取消成绩封号处理。kaggle官方不接受申诉。
开小号组队的话,整个队伍同样只有五次/天。
另外可以开小号提交不同的模型的效果。
如果多个账号提交别人公开的kernel上面的结果会不会被查呢?应该是不会的。
删号如果开了新号以后,你新提交的和删号前提交的一致,就会被视为作弊,我在这里找到了一个有意思的截图:
如果A账号和B账号曾经(注意是曾经)提交过相同的结果,最后结果不一致,会不会被查呢?不清楚
删号的还有一个效果如下:
如果作弊了,删除账号有没有用呢?
我之前注册了两个号码,一个账号没包含名字想改,改不了,然后去注册了第二个账号,
然后第二个账号就被封了,发邮件给kaggle要求删除第一个才能恢复第二个。
然后就删除了第一个。
然后第一个过几天就彻底连discussion上面的信息都没了。
今天删了一次主号,然后重新注册,没问题,所以还有一种办法是,你注册一个小号,五次上限达到了以后,你可以删除这个号然后重新建,提交新的结果,那么这样理论上你就可以在一天内提交无数次。
但是删号会同时删除你之前其他比赛的所有成绩
另外,kaggle的GPU只让用30个小时,所以从媷羊毛角度,小号也是必须的。
小号还有一个作用就是别人发布了kernel 但是没有提交成绩,那么你可以用小号测试下对方的kernel的submission.csv
另外,提交次数的话是根据账户所在ip的时区来更新的,国内的话,是第二天八点准时更新。
有个自称京东的哥们儿作弊直接导致成绩被取消:
这个人发的notebook是:
IEEE cbt 9600 LB solution | Kaggle
一个小技巧,如果是用临时邮箱注册的小号,那么看过的帖子有更新,怎么知道哪些更新的评论是自己没看过的呢?
很简单,在之前看的时候,给评论点赞,这样点赞过的都会有标记,过几天再来看这个帖子,没点赞过得就是没看过的.
如下:
另外,反作弊系统大概运行时间为不到一天.在通过作弊系统以后,才会发放奖牌.
补充:
作弊被kaggle发现后,你的submission.csv 全部会消失。
如果是因为没有上传代码文件(Two-stage 比赛)被取消成绩,那么submission记录将会保留,呈现:
上面这个是正常的。
下面的这个是作弊处理结果:
账号正常的话应该是这样:
也就是说,被查到作弊后,你提交的文件被kaggle吞没作为凭据,按钮"My Submissions消失"你再也不能参加这个比赛了。
另外,还有的人通过两个文件各自乘以一个不同系数来防止"被kaggle认为作弊",注意这个系数不能是这种1.000001
因为小数点后面位数太多的话,两个文件就是一样的了,因为kaggle是计算小数点后面的4~5位,所以
如果你的位数太多,两个文件一致,就会被认为是作弊的了。
举个例子:
帐号a:预测文件predict1.csv=原始文件*1.00001
帐号b:预测文件predict2.csv=原始文件*1.00002
两个帐号分别提交上述结果到同一场比赛,
属于结果一致,会在比赛结束后,两个帐号都会被视为作弊,因为反作弊系统只看前面几位小数.
kaggle具体检测前几位小数?每场比赛检测的小数位数长度各不相同。
一定要记住,如果你开了小号,或者小号借给别人用了,任意两个账号之间的某次提交都不能是同一个文件,如果你乘了一个系数1.000001生成一个文件,kaggle会认为生成后的文件与生成前的一致,视为作弊,两个账号都会有作弊记录,作弊的效果上面的截图中有.被视为作弊后,kaggle禁止申诉,一定要小心,最好是每次提交的时候,都做个记录,严格检查与上次提交的结果不一致。个人比较推荐的习惯就是,每个csv文件只要你修改过,就重命名,并且每次提交文件到kaggle之前,都确定自己提交的是个新名字的文件。
同一个IP登陆多个不同的kaggle账号会不会被判定为作弊呢?
理论上来讲,不会。
①因为一个IP,室内可以团队的各个成员独立参加,他们在百度上的IP都是路由器IP
②IP是动态的,DHCP决定的,也就是每次你启动电脑、打开百度的IP都可以与上一次不一样。所以换位思考,kaggle官方不可能通过绑定"IP和账号"的方式,来判定同一个IP登陆的都是作弊成员。
同一台电脑多个账号提交不同的csv会不会被判定为作弊呢?
理论上来讲,不会。
因为Kaggle没有PC客户端软件,都是网页登陆,理论上来讲,浏览器不会提供你网卡的物理地址给kaggle。不像QQ这种客户端把个人电脑信息扫描个遍。
为什么两个文件里面的数值很接近不会被判定为作弊呢?
因为kaggle的排行榜基本都是在拼小数点后面几位,前几百名成绩都差不多,所以kaggle没法监测这种情况,如果kaggle想要监测,那么kaggle就必须冤枉和错杀排行榜前面做的特别好的一些参赛选手。
注意Two-Stage比赛会同时查stage1和stage2的作弊情况。