自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 建模与调参

建模与调参 1.线性回归模型 线性回归对于特征的要求; 处理长尾分布 理解线性回归模型 2.模型性能验证 评价函数与目标函数 交叉验证方法 留一验证方法 针对时间序列问题的验证 绘制学习曲线 绘制验证曲线 3.嵌入式特征选择 Lasso回归 Ridge回归 决策树 4.模型对比 常用线性模型 常用非线性模型 5.模型调参 贪心调参方法 网格调参方法 贝叶斯调参方法 ...

2020-03-31 21:33:05 145

原创 特征工程

特征工程 1.通过数据探索和分析后,可以察觉数据中的异常值。可以通过箱线图或(3-sigma)分析删除异常值,Box-Cox转换(处理有片分布),也可以长尾截断。 2.一般来说,我们对连续性特征进行归一化处理,而对离散型特征进行独热编码,如果数据分布奇怪,可以先对其取对数再进行归一化处理。 3.对于数据型特征可以进行分桶操作,包括等频分桶,等距分桶,Best-Ks分桶(类似利用基尼指数进行二分类)...

2020-03-28 21:03:12 127

原创 数据挖掘——数据分析总结

数据挖掘——数据分析总结 1.在对数据进行分析的时候,需要首先载入各种数据科学和可视化库,利用这些库可以帮助我们更好的分析数据。常见的数据科学库有pandas,numpy,scipy,而常见的可视化库有matplotlib,seabon 2.拿到数据后的第一件事就是载入数据,分别载入训练集和测试集数据,载入数据后,可以通过head(),shape(),tail()等方式来初步观察数据。 3.初步观...

2020-03-24 20:12:01 997

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除