自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 建模与调参

建模与调参1.线性回归模型线性回归对于特征的要求;处理长尾分布理解线性回归模型2.模型性能验证评价函数与目标函数交叉验证方法留一验证方法针对时间序列问题的验证绘制学习曲线绘制验证曲线3.嵌入式特征选择Lasso回归Ridge回归决策树4.模型对比常用线性模型常用非线性模型5.模型调参贪心调参方法网格调参方法贝叶斯调参方法...

2020-03-31 21:33:05 141

原创 特征工程

特征工程1.通过数据探索和分析后,可以察觉数据中的异常值。可以通过箱线图或(3-sigma)分析删除异常值,Box-Cox转换(处理有片分布),也可以长尾截断。2.一般来说,我们对连续性特征进行归一化处理,而对离散型特征进行独热编码,如果数据分布奇怪,可以先对其取对数再进行归一化处理。3.对于数据型特征可以进行分桶操作,包括等频分桶,等距分桶,Best-Ks分桶(类似利用基尼指数进行二分类)...

2020-03-28 21:03:12 125

原创 数据挖掘——数据分析总结

数据挖掘——数据分析总结1.在对数据进行分析的时候,需要首先载入各种数据科学和可视化库,利用这些库可以帮助我们更好的分析数据。常见的数据科学库有pandas,numpy,scipy,而常见的可视化库有matplotlib,seabon2.拿到数据后的第一件事就是载入数据,分别载入训练集和测试集数据,载入数据后,可以通过head(),shape(),tail()等方式来初步观察数据。3.初步观...

2020-03-24 20:12:01 988

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除