自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 基于序贯蒙特卡洛算法的股票市场波动率预测项目

这里的假设主要在两方面,一方面是等式关系上的假设,具体就是方差的对数服从一个AR(1)模型,另一方面是分布上的假设,具体就是假设给定方差后对数收益率的条件分布是正态分布,此外还假设了状态方程中的noise为正态分布。这一次更新的是统计计算相关的项目,用序贯蒙特卡洛算法来预测股票市场的波动率。波动率的预测在现实中还是很有意义的,可以是市场风险的测度,也被拿来做一些金融衍生产品,而且波动率相关的模型大都是基于数理统计方面的理论,求解也都是根据一些相关的算法来编程求解。这一点和一些机器学习模型还是很类似的。

2024-01-31 21:40:22 963

原创 基于CNN的人脸表情识别

这次的项目是基于卷积神经网络的人脸表情识别,根据公开数据集训练一个能帮我们判断人脸表情的模型,然后随便在网上找一些图片来试验一下效果。),关于两个数据集的异同大家在对应网站上一看便知。

2024-01-16 23:09:27 1001 1

原创 Kaggle房价预测项目

首先介绍一下缺失值的处理,这里用到了比赛官方给的数据描述文件,然后根据每一个缺失变量的描述选择对应的缺失值处理方式,比如有的类别变量训练集测试集都有缺失,就可以把缺失值填补为一个新的取值,比如字符串‘NA’;还有每个模型对应的比赛未知标签的那一部分数据的预测误差和对应比赛排名,stacking模型是上面交叉验证误差最小的几个模型用stacking策略集成得到的最终模型。然后先在一个大范围里找(像LGB就要跑个把小时),然后在得到的参数数值附近找个小范围,在这个小范围里再找预测误差最小的参数。

2024-01-14 00:01:29 583

原创 Kaggle泰坦尼克生存预测项目

主要把Name、Ticket、Cabin这些用不到的feature去掉,训练集去一下空值,把一些分类变量one-hot编码。最近在准备9月份的国赛,先从一些机器学习的算法开始复建,项目是kaggle比较著名的泰坦尼克项目,非常适合新手小伙伴拿来练手。交叉验证的准确率有80%, 最后的测试集准确率竟然有94%。试了下默认的参数,最后的测试集准确率只有七十多...其中用到了L2正则化,里面有一个C是需要我们去调的,用了交叉验证计算验证集的准确率,最后的准确率是。逻辑回归的测试集预测准确率在86%

2023-08-16 00:12:56 106 2

原创 浅浅记录一下

前一阵的期末考试和夏令营终于忙完了,中间摆了一段时间,现在差不多该做一下之前一直想做的一些事情——浅浅记录一下自己在学习数据科学过程中的一些心得吧。上个月被npy拉去参加今年的国赛,虽然已经是数模退役选手,咱也不能掉链子,更新的方向就主要先从数学建模开始吧。最近懒到爆的我也该做一些复健了...

2023-08-10 15:50:20 58 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除