自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Tree Model【hints】

样本集合X,未知的目标函数f(x),假设集合H输入{Xi,Yi}输出f(x)的最佳估计。

2024-07-01 23:08:01 246

原创 阈值调优:处理样本不均衡问题

对于二分类模型,返回的是为预测为正样本的概率和预测为负样本的概率,例如预测出样本为正的概率是0.3, 那一般情况下这个样本就会被预测为负,因为。3个月,判断客户是否流失,表现期总净佣金<=观察期总净佣金*4*0.3 则记为1, 认为可能流失。,否则概率都是0.3, 0.7,0.8这样的,调整阈值改变不大就没必要了。T/F表示预测对/错,P/N表示被预测为正/负。,根据混淆矩阵的偏向进行具体分析后调整。另:测试集里不应该有表现期数据。再或者,我们查看模型预测的。观察期:用于特征处理。12个月,用户行为特征。

2024-04-15 17:56:09 219

原创 [要点] 线性回归、mse、最小二乘

mse因为会平方,所以对离群值有更大的权重,所以二次凹函数的最小化目标为均值;(拟合数据和原始数据的误差平方和即为sse,越接近0拟合的越好,mse为sse的均值。MSE,MAE, RMSE(数据预测结果是否准确), r^2(模型拟合能力)mse的优化目标是平均值,会受离群值影响,误差大权重高;欧氏距离和mse的区别:欧式距离不除以n, 且要加根号。降低模型复杂度,L1(lasso),L2(ridge)多元线性回归拟合图示:一元线性回归是二维的。最小化预测的线离真实值的距离。:预测值与拟合曲线的距离。

2024-04-12 16:01:51 320

原创 量化中的统计基础

此文为要点整理。

2023-08-29 18:01:37 136

原创 时间序列分析【滞后|差分|滚动窗口|单变量&多变量分析】(python)

整理了一下金融时间序列不同于别的数据的比较典型的几个处理方法,欢迎讨论~

2023-02-08 21:33:17 2288 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除