华为大数据挑战赛
文章平均质量分 92
记性太好是我的缺点
这个作者很懒,什么都没留下…
展开
-
整理一下第一次参加华为大数据挑战赛自己的一些收获吧(正式赛篇阶段二)
写在前面 emmm,这篇文章就整理一下我处理正式赛题阶段一(读取数据的方式是分块读取,保存为三个csv文件)的过程吧 赛题介绍: 正式赛题——船运到达时间预测 在企业全球化业务体系中,海运物流作为其最重要的一项支撑。其中,船运公司会和数据供应公司进行合作,对运输用的船通过GPS进行定位以监控船的位置;在运输管理的过程中,货物到达目的港的时间是非常重要的一项数据,那么需要通过船运的历史数据构建模型,对目的港到达时间进行预测,预测时间简称为ETA(estimated time of arrival),目的港到达原创 2020-08-28 21:01:54 · 312 阅读 · 2 评论 -
整理一下第一次参加华为大数据挑战赛自己的一些收获吧(正式赛篇阶段一)
这块大概分三步走: 1.特征筛选 贴一下特征筛选的函数吧(参考大树先生的博客): def get_top_n_features(train_data_X, train_data_Y, top_n_features): #训练集特征:train_data_X,训练集label:train_data_Y,限定特征个数:top_n_features # random forest rf_est = RandomForestClassifier(random_state=0) rf_pa原创 2020-08-26 17:18:51 · 1168 阅读 · 3 评论 -
整理一下第一次参加华为大数据挑战赛自己的一些收获吧(热身赛篇)
去年九月份(应该是上一届比赛结束的时候吧),学校(那时)研一的学长简单讲了这个比赛,但是觉得机器学习很高大上很牛的感觉,听说了这个比赛当时就决定冲一冲,拿不拿奖是其次了,多少能学点东西吧哈哈哈哈~ 当时是根据学长的建议入门的,边看吴恩达的机器学习入门边稍微看了点廖雪峰的python就开始做学生成绩预测以及泰坦尼克生存预测了(进程和线程那块没看,还是偷懒了)。 刚开始学还是很痛苦的,那时候疫情在家,身边也找不到一起入门学习打比赛的同学,就自己一个人硬啃。对着视频一行行敲代码,然后运行调试,查一个个函数的用法,原创 2020-08-21 13:05:55 · 878 阅读 · 0 评论