自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 Python金融数据分析-资产波动率模型1

在统计学中,如果一个概率分布的尾部比正态分布的尾部更“厚”或更“重”,则称该分布具有厚尾特性,这意味着极端值出现的概率比正态分布预期的要高。这种分布能更好地捕捉到数据中的极端变化,特别是在金融市场中的极端损失或收益。因此在实际情况中可能会将看作自由度为的标准t分布。其分布密度为:据此可得条件似然函数并求得在t分布下的最大似然估计。注意:先验地通常取3至6之间。

2024-02-07 16:23:43 1021

原创 Python金融数据分析——数据可视化

首先是导入和绘图定制操作上述代码设置了x和y随机数,接下来调用plt.plot()函数绘图。如果只提供y值,plot以索引值为x值。接下来介绍2D图表的几项基本设置。一般而言,对于包含多个单独的子集,且每个子集的绘制有不同的标准时,可以通过直接绘图(这种情况下plot函数会自动分类数据)或者申明具体数据组来绘图,同时添加其他通用函数以及进一步的注释帮助用户理解。特别地,如果出现两组数据的刻度差别过大时,一个统一的刻度可能导致某个数据组不可视。为此解决方法有:使用左右两种刻度的y轴;使用上下两种视图。

2023-10-06 19:08:46 588

原创 Python金融大数据分析——Pandas库

DataFrame是一种提供了列标签以及数据集中各行的索引功能,这些数据和来自SQL数据库表或Excel电子表格中工作表的数据相似以上是创建DataFrame对象的过程,特别指定了索引值和标签。这个例子体现了DataFrame在储存数据时数据本身可以用不同组成及类型(列表、元组、ndarray和字典对象等);数据以列的方式被组织,列名可自定义;索引的格式可以不同(数值、字符串、时间信息等)。因此,考虑到其总体上特点,在扩大现有对象等工作时刻考虑使用DataFrame。

2023-10-05 15:31:42 218

原创 Python金融大数据分析——面向对象编程

面向对象编程(OOP)的概念在过往的文章中已有探讨,现在我们先简单回顾。类,是对某一类对象的抽象定义;与之相对的对象,指的是类的一个实例。方法,是类可以实现的一个操作;属性是类或者类实例的特征。以下给出一个实现“简历”的一个简单类实例代码。

2023-10-03 15:34:19 160

原创 Python金融大数据分析——NumPy

由于金融应用往往具有在特定数据结构上进行高性能操作的要求,因此掌握重要的数据结构之一——数组十分重要。数组通常在行和列中存放相同数据类型的其他对象,在学习NumPy等库之前,我们先了解数组的两种替代方法。

2023-10-03 14:42:26 411

原创 统计分析基于R—随机模拟(附代码)

当用概率统计模型处理实际问题时,我们往往需要平衡好模型复杂度和理论可验证性之间的关系。简化的模型往往与实际情况有较大的差距,即使我们对模型进行了完美的理论分析,也不能保证分析结果是可信的,随机模拟方法应运而生。模拟是指把现实或抽象系统的某些特征或部分状态用模拟模型来替代。并根据具体问题使其变成一个概率模型求解。随机模拟方法就是对产生符合模型的大量随机数进行分析而求解问题。该方法又称为蒙特卡洛方法。最经典的蒙特卡洛方法就是通过计算所有落在正方形的点中落在圆形区域内的个数来估计的值。

2023-08-10 08:53:01 1162

原创 量化交易——期货期权(附代码)

例如一个简单的单步二叉树模型,假设当前价格以及未来两个可能价格已知的情况下,我们可以构造一个股票和期权的组合,并使这一组合在一定时间后的价值没有不确定性。在树的最后节点上期权的价格等于欧式期权的价格,之前的任意节点期权价格为。美式期权的价格就是在每个节点上现金流的折现值,而这里的最大化原则是由T时刻全部可能事件决定的期权的最佳行权时刻来确定。美式期权的特性决定了期限较短的期权在行使时,较长期限的期权也可以被行使,因此,长期期限权的价格至少不会低于短期期限权的价格。为看跌期货期权的价格。

2023-08-03 00:50:49 257

原创 统计计算基于R——随机数(附代码)

需要某种分布的随机数时,可以先生成均匀分布随机数,而后转换得到其他分布的随机数。好的随机数序列应该周期足够长,统计性质符合均匀分布,且需要有很好的随机性,即起排列不应该有规律,序列中的两项不应该有相关性。除此之外,还有几何分布、独立试验序列、二项分布、泊松分布随机数等构造,其本质上是利用2.1提及的离散随机变量的构造方法构造迭代序列并生成符合一定分布的序列。实际问题中两个随机变量的边缘分布明确,但是它们之间的关系比较模糊,此时可以利用copula分布来粗略地表示联合分布。例如生成多项分布随机数。

2023-07-22 15:17:48 1050

原创 Python数据挖掘与机器学习——关联分析算法代码实现

关联分析是关联规则挖掘,目标是发现事务数据库中不同项之间的联系,这些联系构成的规则可以帮助用户找出某些行为的特征。

2023-07-20 10:04:11 719 1

原创 统计计算基于R——基本概念(附代码)

适定性定义为输入微小变化对输出量的影响。在实际过程中我们希望初值的测量的一定误差不会给最终结果带来太大的影响,因此为了问题的适定性,定义条件数如下一元可微函数时成立当条件数较小比如的时候可以设计算法给出问题的精确解。条件数大的问题成为病态问题,条件数为无穷或者不存在的时候成为不适定问题。

2023-07-20 09:11:14 173 1

原创 多元统计分析基于R——对应分析

对应分析和主成分分析和因子分析方法有着密切的联系。对应分析主要适用于变量X和变量Y之间不独立的情形,是从R型因子分析出发直接获得Q型因子分析的结果,从而克服由于样本容量大所带来的困难。具体来说,从原始数据矩阵出发构建过渡矩阵,在得变量的协方差矩阵和样品的协方差(其非零特征值相同,其特征根之间存在特定关系)。特征值是各个公共因子的方差,可用相同的因子轴同时表示变量点和样本点。

2023-07-14 09:24:15 687 1

原创 量化交易——波动率

在布莱克-斯科尔斯-默顿定价公式中,价格的波动率是无法直接观测到的。在金融市场上波动率被投资者用于衡量资产价格波动的剧烈程度,而资产价格波动本质上反映了资产蕴含的风险,例如股票的波动率用于度量股票收益产生的不确定性,通常介于15%-60%之间。波动率一般分为历史波动率、已实现波动率、预期波动率和隐含波动率。在实际中,交易员通常使用隐含波动率(implied volatility),这一波动率是指由期权的市场价格所含的波动率。隐含波动率反应了市场对未来股价波动的预期,是计算期权价格的重要因素之一。

2023-05-27 10:36:03 616

原创 Python数据挖掘与机器学习——决策树算法代码实现

建立IF-THEN分类规则,即每个内部属性值形成规则前件(IF部分)的一个合取项,叶子结点形成规则后件(THEN部分)注意这里对数函数以2为底是因为信息用二进制位编码,但并非不可改变。无条件熵反映了该属性中各类别取值的平均自信息量,即平均不确定值。决策树由:根节点、内部节点和叶子节点。前两者的作用在于根据属性对对对象进行划分,而后者是分类的结果。熵是指类别属性的不确定性,而决策树算法的本质是通过描述属性从而减少熵。通过特征重要性的表格可以观察到不同特征的重要程度。是该属性分类出现的概率。

2023-05-23 21:41:07 812

原创 基于R语言的主成分分析(附代码)

主成分分析也成为主分量分析,在实际问题中变量之间可能存在一定的相关性。因此若可以使用个数较少但是保留了原始变量大部分信息的几个不相关的综合变量来代替原来的较多变量,就能简化数据,从而对原来复杂的数据关系进行简明有效的统计分析。其本质是“有效降维”,既要减少变量个数,又不能损失太多信息。当一个变量住区一两个数据时提供的信息非常有限,变量的变异性越大,说明它提供的信息量越。主成分分析中的信息,就是变量的变异性,用标准差或者方差来表示。

2023-05-20 19:06:36 6538

原创 基于R语言的因子分析(附代码)

用少数几个不可观测的随机变量(因子)去描述许多随机变量之间的协方差关系。主义因子分析可以视作主成分分析的一种推广,但因子是不可观察且不必是相互正交的变量。其基本思想是:根据相关性大小将变量分组,每组变量代表一个基本结构,反映观测到的相关性。R型因子分析可以用来研究变量之间的相关关系,Q型因子分析研究样品之间的相关关系,二者知识形式上的不同数学处理上是一样的,本文以R型因子为例展开说明。

2023-05-20 16:18:23 6044 5

原创 Python逻辑回归——以车险定价为例(附代码)

保费定价也成为费率厘定,是保险公司运营的环节之一。其过程是根据保单(被保险人)的损失经验和其他相关信息建立模型,并且对未来的保险成本(赔款、代理人佣金、一般管理费用、理赔费用以及支持该业务所需的资本金成本)进行预测的过程。保险公司实际使用的费率还会受到市场供求关系和公司自身发展战略的影响。汽车保险也称机动车辆保险,失意机动车辆本身及其第三者责任等为保险标的的一种运输工具险,在非寿险井算领域中占有重要地位。

2023-05-18 20:13:53 757 1

原创 Python时间序列分析详细实例(附代码)

正常的数据类型分为三种:横截面数据、时间序列数据和面板数据三类。其中,时间序列是按照一定的时间间隔排列的一组数据,其时间间隔可以是任意的时间单位,如小时、日、周月等。在本例中为每天某产品的需求量,这些数据形成了以一定时间间隔的数据。时间序列数据包含时间要素和数值要素,通过对这些时间序列的分析,从中发现和揭示现象发展变化的规律,并将这些知识和信息用于预测。比如需求量是上升还是下降,是否与季节有关,是否可以通过现有的数据预测未来的需求量是多少等。其变化规律有:长期趋势、季节趋势、循环变动和不规则变动四种。

2023-05-02 09:53:39 4662 2

原创 基于R多元统计分析——判别分析(附代码)

判别分析是在已知样品分类的前提下,将给定新样品按照某种分类判入某类的分析方法。距离判别其中是x,y随机向量的协方差矩阵。马氏距离的作用在于消除了变量单位不一致的影响更加合理。当两个总体的协方差不同时应使用二次判别。FISHER判别将高维的点投影到一条直线y上,使G1和G2中的点在y上的投影靠近而彼此之间分开Bayes判别假定对研究对象有一定的认识,可以用先验概率描述,样本的作用在于修正已有的先验概率分布得到后验分布,再通过后验分布进行各种统计推断。

2023-04-10 08:47:49 1553 8

原创 基于R多元统计分析——聚类算法代码实现

以全国各城市空气质量年度数据为例。分别应用系统聚类算法和K均值聚类法对数据进行分析。

2023-04-08 16:20:37 848

原创 Python数据挖掘与机器学习——回归模型(附代码)

除了上述的几种线性回归模型外还有逻辑回归模型尚未讨论。逻辑回归模型本质上是在预测概率,试用于分析二分类或有次序的因变量和自变量之间的关系,是分类模型。该模块的相关结论和代码实现将在未来的文章中再详细分析。本篇文章是笔者自行学习总结得出,若有错处还望温和批评指正。

2023-04-08 11:27:10 749

原创 Python超实用零基础入门(六)—小技巧

本文是python中最实用基础知识系列的最后一篇,适合于不需要master python的朋友碎片化阅读使用。如有不妥之处还望温和留言指正

2023-02-26 15:28:20 56

原创 Python零基础入门(五)—JOSN等

本章主要讨论了python中模块、日期、JSON和RegEx的相关知识

2023-02-25 19:32:36 40

原创 PYTHON零基础入门(四)——类和对象

本届聚焦于python中类和对象,介绍子类父类基本概念和继承迭代的相关知识

2023-02-24 16:52:37 41

原创 PYTHON零基础入门(三)—定义函数

python函数

2023-02-23 20:01:30 38

原创 PYTHON最基础知识(二)—数据类型

有效帮助初学者小白系统掌握python的基础操作

2023-02-22 20:29:35 34

原创 python基础指令(一)

python学习摘记

2023-02-21 21:20:24 120

原创 【python文本挖掘】Note1

[coursera]applied text mining with python

2023-02-18 16:12:12 66

衍生品_随机森林.py

衍生品_随机森林.py

2023-11-30

金融衍生品定价.py

金融衍生品定价.py

2023-11-30

data.xlsx

data.xlsx

2023-11-30

衍生品_优化.py

衍生品_优化.py

2023-11-30

car 2.pages

car 2.pages

2023-10-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除