• 博客(20)
  • 资源 (14)
  • 收藏
  • 关注

原创 拓端tecdat|基于R语言股票市场收益的统计可视化分析

金融市场上最重要的任务之一就是分析各种投资的历史收益。要执行此分析,我们需要资产的历史数据。数据提供者很多,有些是免费的,大多数是付费的。在本章中,我们将使用Yahoo金融网站上的数据。...

2020-09-25 14:42:36 5514

原创 拓端tecdat|R语言状态空间模型:卡尔曼滤波器KFAS建模时间序列

原文链接:http://tecdat.cn/?p=67621 时间序列时间序列是指同一种现象在不同时间上的相继观察值排列而成的一组数字序列。统计学上,一个时间序列即是一个随机过程的实现。时间序列按其统计特性可以分为平稳时间序列和非平稳时间序列两类。在实际生活中遇到的序列,大多数是不平稳的。说明:如果一个序列的平均值和方差始终为常数,则它是平稳的。在估计时间序列模型之前需把不平稳的时间序列转化为平稳序列。判断一个时间序列的平稳性可通过数据图和自相关函数图,如果数据图呈现线性或二次趋势形状,则该时间

2020-09-24 20:30:35 1935

原创 拓端tecdat|用R语言中的神经网络预测时间序列:多层感知器和极限学习机

对于此示例,我将对AirPassengersR中可用的时间序列进行建模。我将最后24个观察值保留为测试集,并将使用其余的观察值来拟合神经网络。当前有两种类型的神经网络可用,多层感知器;和极限学习机。...

2020-09-24 16:33:47 1687

原创 拓端tecdat|R语言关联挖掘实例(购物篮分析)

原文链接:http://tecdat.cn/?p=16297关联挖掘通常用于通过识别经常一起购买的产品来提出产品推荐。但是,如果您不小心,则规则在某些情况下可能会产生误导性的结果。

2020-09-23 17:26:24 1826 3

原创 拓端tecdat|R语言SIR模型(Susceptible Infected Recovered Model)代码sir模型实例

原文链接:http://tecdat.cn/?p=14593SIR模型定义SIR模型是一种传播模型,是信息传播过程的抽象描述。SIR模型是传染病模型中最经典的模型,其中S表示易感者,I表示感染者,R表示移除者。S:Susceptible,易感者I:Infective,感染者R:Removal,移除者SIR模型的应用SIR模型应用于信息传播的研究。传播过程大致如下:最初,所有的节点都处于易感染状态。然后,部分节点接触到信息后,变成感染状态,这些感染状态的节点试....

2020-09-23 15:58:27 2441 2

原创 拓端tecdat|R语言机器学习实战之多项式回归

原文链接:http://tecdat.cn/?p=2686如果数据比简单的直线更为复杂,我们也可以用线性模型来你和非线性数据。一个简单的方法就是将每一个特征的幂次方添加为一个新的特征,然后在这个拓展的特征集上进行线性拟合,这种方法成为多项式回归。回归分析的目标是根据自变量(或自变量向量)x 的值来模拟因变量 y 的期望值。在简单的线性回归中,使用模型其中ε是未观察到的随机误差,其以标量 x 为条件,均值为零。在该模型中,对于 x 值的每个单位增加,y 的条件期望增加β1β1个单位。在许.

2020-09-22 22:57:38 1368

原创 拓端tecdat|WINBUGS对随机波动率模型进行贝叶斯估计与比较

现有的有关财务模型的大多数文献都假设资产的波动性是恒定的。然而,这种假设忽略了波动聚类,高峰,厚尾,波动性和均值回复的实际市场回报的特点,不能用恒定的波动模型。资产存在市场制度下,其波动性在不同时间段内会发生显着变化。在2007 - 2008年金融危机是市场波动时期的好例子。因此,Black Scholes模型的自然扩展是考虑非恒定波动率。史蒂文·赫斯顿(Steven Heston)提出了一个模型,该模型不仅考虑了随时间变化的波动性,而且还引入了随机(即不确定性)成分。这是著名的Heston随机波动率模

2020-09-21 23:37:05 1213

原创 拓端tecdat|R语言使用HAR-RV预测实际波动率Realized Volatility案例

原文链接:http://tecdat.cn/?p=3832在建议用于预测已实现波动率的模型中,Corsi的HAR-RV在性能和简便性方面均脱颖而出。“ HAR-RV”代表已实现波动性的异质自回归模型,并且基于所谓的“异质市场假说”。这表明,金融市场是人们以不同的频率行事的相互作用(例如,以高频率运行的公司,日内交易的交易商和低频率的机构投资者)。每一类市场都会以不同的频率引起波动,这将在一定程度上影响彼此。从这些考虑出发,想到了独立但联合地对每个波动频率建模的想法。这使我们得出以下结构非常简单的.

2020-09-19 23:42:51 3456

原创 拓端tecdat|R语言风险价值VaR(Value at Risk)和损失期望值ES(Expected shortfall)的估计

风险价值VaR和损失期望值ES是常见的风险度量。

2020-09-17 14:07:16 9881 1

原创 拓端tecdat|R语言公交地铁路线进出站数据挖掘网络图可视化

对于庞大的公交地铁路线信息的数据挖掘,一般软件遇到的问题主要有两点:1.对于文本信息的挖掘,特别是中文词汇的挖掘,缺乏成熟的工具或者软件包,2.对于大数据量,一般软件的读取和处理会遇到问题。即使一个月的部分区域路线信息也会达到几百m以上,因此,对于这类数据,无论从算法运行还是数据读取来说普通的SQL语言或者matlab软件处理起来都乏善可陈。对于这类数据,我们一般用r软件可以轻松实现读取,数据挖掘以及可视化的过程。例如对于下面这样的车站数据:和近600M的进出站信息的数据, 如果要实现每隔一段时间的

2020-09-16 15:42:20 775 5

原创 拓端tecdat|TensorFlow 2.0 keras开发深度学习模型实例:多层感知器(MLP),卷积神经网络(CNN)和递归神经网络(RNN)

深度学习模型生命周期在本部分中,您将发现深度学习模型的生命周期以及可用于定义模型的两个tf.keras API。五步模型生命周期模型具有生命周期,这一非常简单的知识为建模数据集和理解tf.keras API提供了基础。生命周期中的五个步骤如下:定义模型。 编译模型。 拟合模型。 评估模型。 作出预测。让我们依次仔细研究每个步骤。定义模型定义模型要求您首先选择所需的模型类型,然后选择体系结构或网络拓扑。从API的角度来看,这涉及到定义模型的各层,为每个层配置许多节点和

2020-09-16 14:19:29 2250

原创 拓端tecdat|Python安装TensorFlow 2、tf.keras和深度学习模型的定义

深度学习的预测建模是现代开发人员需要了解的一项技能。TensorFlow是Google开发和维护的首要的开源深度学习框架。尽管直接使用TensorFlow可能具有挑战性,但现代的tf.keras API使得Keras在TensorFlow项目中的使用简单易用。使用tf.keras,您可以设计,拟合,评估和使用深度学习模型,从而仅用几行代码即可做出预测。它使普通的深度学习任务(如分类和回归预......

2020-09-15 15:46:46 1484

原创 拓端tecdat|TensorFlow 2建立神经网络分类模型——以iris数据为例

这个教程将利用机器学习的手段来对鸢尾花按照物种进行分类。本教程将利用 TensorFlow 来进行以下操作:构建一个模型, 用样例数据集对模型进行训练,以及 利用该模型对未知数据进行预测。TensorFlow 编程本指南采用了以下高级 TensorFlow 概念:使用 TensorFlow 默认的eager execution开发环境, 使用Datasets API导入......

2020-09-14 15:34:03 1670

原创 Matlab建立SVM,KNN和朴素贝叶斯模型分类绘制ROC曲线

绘制ROC曲线以通过Logistic回归进行分类加载样本数据。

2020-09-10 15:17:15 3407 2

原创 R语言线性分类判别LDA和二次分类判别QDA实例

一、线性分类判别对于二分类问题,LDA针对的是:数据服从高斯分布,且均值不同,方差相同。概率密度:p是数据的维度。分类判别函数:可以看出结果是关于x的一次函数:wx+w0,线性分类判别的说法由此得来。参数计算:二、二次分类判别对于二分类问题,QDA针对的是:数据服从高斯分布,且均值不同,方差不同。数据方差相同的时候,一次判别就可以,如左图所示;但如果方差差别较大,就是一个二次问题了,像右图那样。从sklearn给的例子中,也容易观察到:...

2020-09-09 15:41:20 1672

原创 R语言POT超阈值模型在洪水风险频率分析中的应用研究

结合POT模型的洪水风险评估能够从有限的实测资料中获取更多的洪水风险信息,得到更贴近事实的风险评估结果,能为决策者提供更多的依据,从而使决策结果更加可靠实用。

2020-09-07 17:01:33 1033 1

原创 用RSHINY DASHBOARD可视化美国投票记录

原文链接:http://tecdat.cn/?p=5136交互式图表与Plotly与RSHINY图表相关的主要原因是它的内置交互性。我希望用户只是将鼠标悬停在积分上,然后看到一段描述上一年转变的文字。结果很简单,只是有点难看paste。一个奇怪的事情是alpha功能,它被控制toRGB("colour", "alpha"),但称为不透明度plotly。在应用程序中,默认情况是在1990年显示参议院共和党人(即与1989年的差异):​ggExtra整个项目基本上是我整.....

2020-09-04 16:34:58 539

原创 R语言使用bootstrap和增量法计算广义线性模型(GLM)预测置信区间

考虑简单的泊松回归。给定的样本,其中,目标是导出用于一个95%的置信区间给出,其中是预测。因此,我们要导出预测的置信区间,而不是观测值,即下图的点

2020-09-03 13:20:11 2218 1

原创 游记数据感知旅游目的地形象|文本挖掘:主题模型(LDA)及R语言实现分析游记数据

越来越多的人愿意精神消费。旅游不仅可以提升人们对外地环境和外地人文的认知,也可以放松身心、愉悦心情,是一种受欢迎的精神消费。▼随着国内近些年来互联网的发展,越来越多的人开始线上消费,消费感受的推荐成为了潮流。在各个旅游平台上,越来越多的人愿意参与旅游目的地游玩感受的分享。本文试图从马蜂窝旅游官网上就新疆这个旅游目的地游记进行感知分析。游记表现出多元复杂的情感通过情感分析(也称为意见挖掘),用文本挖掘和计算.........

2020-09-02 12:34:51 1783

原创 R语言作图不显示中文解决办法,如何使用中文字体

预期R语言绘图中的中文默认字体宋体,希望用其他字体绘图。实际使用“雅黑字体”出现乱码重现问题的步骤Windows7系统,R ×64 3.2.0重现问题的步骤 程序:windowsFonts(+ A=windowsFont("华文彩云"),+ B=windowsFont("华文仿宋"),+ C=windowsFont("华文行楷"),+ D=windowsFont("华文楷体"),+ E=windowsFont("华文隶书"),+ F=w...

2020-09-01 17:10:04 6918

【原创】R语言中生存分析Survival analysis晚期肺癌患者4例数据分析报告论文(代码数据).docx

【原创】R语言中生存分析Survival analysis晚期肺癌患者4例数据分析报告论文(代码数据).docx

2021-09-06

【原创】R语言中的生存分析Survival analysis晚期肺癌患者4例数据分析报告论文(代码数据).docx

【原创】R语言中的生存分析Survival analysis晚期肺癌患者4例数据分析报告论文(代码数据).docx

2021-08-25

【原创】R语言使用二元回归将序数数据建模为多元GLM数据分析报告论文(代码数据).docx

【原创】R语言使用二元回归将序数数据建模为多元GLM数据分析报告论文(代码数据).docx

2021-08-25

【原创】Python贝叶斯回归分析住房负担能力数据集数据分析报告论文(代码数据).docx

【原创】Python贝叶斯回归分析住房负担能力数据集数据分析报告论文(代码数据).docx

2021-08-25

【原创】R语言在不同样本量下的Little‘s MCAR检验数据分析报告论文(代码数据).docx

【原创】R语言在不同样本量下的Little‘s MCAR检验数据分析报告论文(代码数据).docx

2021-08-25

【原创】R语言中的Theil-Sen回归分析数据分析报告论文(代码数据).docx

【原创】R语言中的Theil-Sen回归分析数据分析报告论文(代码数据).docx

2021-08-25

【原创】R语言关于回归系数的解释数据分析报告论文(代码数据).docx

【原创】R语言关于回归系数的解释数据分析报告论文(代码数据).docx

2021-08-25

【原创】R语言对二分连续变量进行逻辑回归数据分析报告论文(代码数据).docx

【原创】R语言对二分连续变量进行逻辑回归数据分析报告论文(代码数据).docx

2021-08-25

【原创】R语言中使用多重聚合预测算法(MAPA)进行时间序列分析数据分析报告论文(代码数据).docx

【原创】R语言中使用多重聚合预测算法(MAPA)进行时间序列分析数据分析报告论文(代码数据).docx

2021-08-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除