- 博客(3)
- 收藏
- 关注
原创 建模与调参
建模与调参 1.线性回归模型 线性回归对于特征的要求; 处理长尾分布 理解线性回归模型 2.模型性能验证 评价函数与目标函数 交叉验证方法 留一验证方法 针对时间序列问题的验证 绘制学习曲线 绘制验证曲线 3.嵌入式特征选择 Lasso回归 Ridge回归 决策树 4.模型对比 常用线性模型 常用非线性模型 5.模型调参 贪心调参方法 网格调参方法 贝叶斯调参方法 ...
2020-03-31 21:33:05 145
原创 特征工程
特征工程 1.通过数据探索和分析后,可以察觉数据中的异常值。可以通过箱线图或(3-sigma)分析删除异常值,Box-Cox转换(处理有片分布),也可以长尾截断。 2.一般来说,我们对连续性特征进行归一化处理,而对离散型特征进行独热编码,如果数据分布奇怪,可以先对其取对数再进行归一化处理。 3.对于数据型特征可以进行分桶操作,包括等频分桶,等距分桶,Best-Ks分桶(类似利用基尼指数进行二分类)...
2020-03-28 21:03:12 127
原创 数据挖掘——数据分析总结
数据挖掘——数据分析总结 1.在对数据进行分析的时候,需要首先载入各种数据科学和可视化库,利用这些库可以帮助我们更好的分析数据。常见的数据科学库有pandas,numpy,scipy,而常见的可视化库有matplotlib,seabon 2.拿到数据后的第一件事就是载入数据,分别载入训练集和测试集数据,载入数据后,可以通过head(),shape(),tail()等方式来初步观察数据。 3.初步观...
2020-03-24 20:12:01 997
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人