比赛
Lzj000lzj
这个作者很懒,什么都没留下…
展开
-
tencent_ad_compeition
复赛与竞争量有关计算每个旧广告在每天每个广告位的曝光量和竞争量,曝光量除以竞争量=曝光率,得到每天的曝光率。旧广告规则:100-22号的广告语23号的广告有重叠,24号旧广告的exp=0.75exp23+0.25*exp10-22旧广告建模:特征:10号到22号的竞争量曝光率,将18号作为validdata,用18号之前的数据对18号曝光量进行预测再将旧广告的规则与旧广告建模的结果进行融...原创 2019-07-18 19:51:41 · 286 阅读 · 0 评论 -
IEEE Fraud Detection Competition思路探索
训练集和测试集的数据分在两个不同的表里。通过统计发现只有少部分train_transaction中的TransactionID可以在train_identity中找到对应# Here we confirm that all of the transactions in `train_identity`print(np.sum(train_transaction['TransactionID...原创 2019-07-18 19:52:35 · 1242 阅读 · 0 评论 -
kaggle数据分析的学习经验
由于大多数机器学习模型对非正态分布的数据的效果不佳,因此,我们对数据进行变换,修正倾斜:log(1+x)删除离群点train.drop(train[(train['OverallQual']<5) & (train['SalePrice']>200000)].index, inplace=True)train.drop(train[(train['GrLivArea'...转载 2019-07-19 21:33:57 · 962 阅读 · 0 评论