自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 2020-11-19

第一次报告 结果 模型选择 LGB模型 由于现在的比赛数据越来越大,lightgbm是一个非常不错的选择,其可达到与xgboost相似的预测效果。 处理过程 把数据缺失的和单一值多的直接扔了 数据清洗 对于很多重复的数据进行分析删除 重新计算一些数据的分布过程 对于缺失值查看是否有补全的需要,如果缺失的比较少,那么就进行补全 训练 采用LGB进行训练,首次提交效果还不错 ...

2020-11-19 00:06:50 100

原创 2020-11-12

周报 本周主要对模型重新训练了一下,但是结果没有什么改进,在此基础上已经基本到头了,因此只能是略作修改,对于本周的数据,可以分析的空间并不大。只能是对于数据的分布,网络,去重还有删改进行小修小补,总体改进很小。 ...

2020-11-12 23:58:50 166

原创 2020-11-02

数据挖掘报告 关于训练 本周使用了新的神经网络,并且配置好了linux环境下的python训练系统,调试起来更加方便 数据的调整 对于数据清洗部分进行了进一步优化,将其中部分无意义的数据进行了删除,对于常规数据进行了分布的优化,将大部分数据优化成正态分布,对于训练结果有明显的提升,本周效果不错,相比之前的数据结果好了很多。 之前走入了歧途,结果不升反降,本周对于这个问题有了明显的优化改进。 结果 ...

2020-11-02 22:24:32 104

原创 2020-10-27

数据挖掘周报 本周按照之前讲解的方法进行了优化,对于一些特殊的数据进行了删除,例如全1的数据,大部份都是1的数据进行了剔除,但是结果很不理想,线上提交测试居然准确率下降,目前我也没有明白具体的原因。可能猜测如下: 1.其中有几行几乎95的数据都为1 ,在本题中是一个isDefault的强相关特征 2.某几行数据可能具有关联,删除之后这种关联消失了,导致了结果的下降 3.数据变少了,可能发生过拟合?(不确定会不会有这种情况发生 排名 ...

2020-10-27 11:34:28 191

原创 2020-10-20

数据挖掘报告 本周对于网络结构还有训练过程进行了改进,但是实际上并没有什么用,并且分数还有所下降,使用matlab集成的神经网络功能还是太弱了,并且训练速度很慢,这周计划使用以下python的pytorch来进行新的训练,并且把训练过程迁到服务器上,进行更仔细地调试。 下一步 着重改善数据本身的处理,数据的维度,补充,还有分布等进行改善从而提升效果。 ...

2020-10-20 23:53:32 193

原创 天池数据挖掘

数据挖掘周报 数据清洗 这周按照上次所讲的一些只是对于数据进行了清洗,将部分空数据进行了补全,对于大部分数据进行了补0,部分数据按照数据中最可能出现的数据进行补全。 网络结构 本次尝试对于不同层数的网络结构进行学习,但是改观不大,从30层到两百层都有尝试,但是结果很接近,目前的准确率到了0.7251出现了一点瓶颈 本次实验结果 ...

2020-10-12 16:36:45 318

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除