总结一下这几个月实习的项目

第一个项目是有关反作弊的,基于小组讨论的准则来进行的规则判断,这是我人生中接触的第一份实习工作,第一个独立的任务,中间经历了很多的bug,让我一度相信那句话,项目锻炼人。之前写sql语句的时候,没想到平时学的简单的语句能在项目中起到关键作用,尤其感慨基础的重要性,我在学校写的最多的sql语句,也就十几二十行的样子,业务需要关联4个表,写了近100多行的sql语句,这并不算完,几次测试都通不过,在MaxCompute上跑的结果和预期相差比较大,最后究其原因,把一个字段漏写了,真是浪费时间。因此,好的开发工具,清晰的逻辑思维,较强的基础,那在业务中的工作效率自然而然会高。

 第二个项目是运用机器学习模型来进行对订单的预测,和一个同事一起完成的,说说我的感受吧,最大的感受就是,面试时让手推SVM,LR,贝叶斯等等,工作中真正用的很少。但是了解一个模型的原理,能够帮助你更好的调参,这毋庸置疑。做的最多的就是,需要对数据进行清洗,很多时间不是让你去训练模型,而是要拿到比较干净的数据。在我实际的工作中也确实是这样的,因为数据不干净,再牛逼的模型都跑不出来想要的结果。天气模型这个数据清洗,花了将近半个多月,因为中间特征在变,数据也在不断的变化,由于我们的label受到多种条件因素的影响,需要加入更多的特征去预测最后的label。包括最后模型在预测集上跑的结果,并不是我们想要的,这个时候去分析样本发现,根本没有那样的数据,因此你让模型预测,它根本学不到,或者是没学好。在模型预测的基础上,我们加入了规则的判断,这样提升了指标,效果比较明显。当然了,目前还在不断的测试中,按照目前的堆叠模型来预测,加上规则的判断,已经能够达到较高的准确度。
第三个项目目前还在不断的调试中。用的最多的就是GBDT和LR以及常用一些Pandas来进行数据的分析,和筛选。当然了,Excel表格也得用的很666,目的是为了更好的处理数据,筛选数据,减少工作量。
已经很晚了,不写了。有时间再接着更新!


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

想做个自由的人

随缘吧打赏与否还是会坚持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值