自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 WINDOWS家庭版安装docker desktop

【step1】家庭版安装虚拟机hyper-V通过一个脚本安装虚拟机:link【step2】安装doker desktop通过更改注册表信息link【step3】遇到的错误link

2020-04-16 11:30:09 190

原创 数据挖掘_第三节

数据预处理达到:符合用于模型加工计算的数据类型提高效果:1)提高数据质量 2)尝试新的算法why?现实世界数据处理的瑕疵现实数据是我们再特定情况下所能拿到的一部分数据——思考:能够真实的反映现实情况吗?数据缺失数据冗余总结出来的规则模型和经验模型——有其自身的道理和组织性。数据抽取数据抽取是从数据源中抽取数据的过程。解决方案:ETL:是英文Extract-Trans...

2020-03-06 16:55:45 175

原创 金融数据分析导论

参考书目:《应用时间分析》 人大版《金融数据分析导论——基于R语言》时序模型时间序列的定义:按照时间顺序排列起来的随机变量,记为 {XtX_tXt​,t∈Tt \in Tt∈T}时间序列分析的类型:按照分析方法来分:频域(任何一个无趋势的时间序列都可以拆分成多个频率不同的周期波动,然后使用傅里叶变化,使用正弦余弦函数去逼近某个函数)时域:其基本思想是事件发展通常都有一定的惯性,用...

2020-03-04 14:31:17 1430

金融数据分析_lecture-3

自相关函数偏自相关函数** 信息准则**结合了模型的拟合程度(使用似然函数)、模型复杂度(k)判断拟合优劣:赤池信息准则(AIC)BICmm1 = ar(ts,method=‘mle’)aic=mm1$aic** 参数估计**** 模型的检验 **模型是否充分:残差是否为白噪声 Ljung-Box** 预测**条件期望,对未来的期望值...

2020-03-02 17:17:54 192

原创 金融数据分析-lecture-2

lecture-1遗留部分线性模型非线性模型根据衍生品价格反推标的波动率市场恐慌-大量抛售-隐含波动率上涨关于收益率对数收益率简单收益率对数超额收益率相关统计概念联合分布、累积分布、p分位、p-value、条件分布L阶矩:不同阶矩表达了什么中心阶矩——偏度(对称性)、峰度(密度函数的锋利性)如何计算这些样本统计量均值、方差、偏度、峰度分布的检验样本偏度和样本峰度...

2020-03-02 13:42:33 1348

原创 使用pandas做数据处理

处理目的对已有的指标进行简单的加减乘除处理求单个企业营业收入的行业占比根据证券代码判断是否是为ST判断审计机构是否是四大去除空值、去除资产负债率大于1的企业使用函数、方法groupby列表生成式.locmergeconcatapplylambda表达式具体操作直接对对应索引 +、-、*、/使用groupby,merge函数df ['行业总值']= pd...

2020-02-13 19:56:03 192

原创 数据分析总结贴

数据分析总结贴计量经济学经典线性回归虚拟变量回归(Dummy Variables)面板回归时间序列分析平稳时间序列分析非平稳时间序列分析多元时间序列分析混频数据分析多元应用统计聚类分析因子分析判别分析主成分分析机器学习分类模型回归模型模型验证预测调参深度学习与tensorflowCNNRNNLSTM量化投资数据预处理方法因子计算与因子筛选基本面因子模型Z值法分层回测SQL金融工程蒙特卡罗模拟风险度...

2020-02-09 17:12:02 292

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除