自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (37)
  • 收藏
  • 关注

转载 VC维的理解

            

2018-12-27 16:18:39 301

原创 面试中的投资组合方差计算

  

2018-12-27 13:32:16 3188

转载 MSE与MAE的区别与如何选择

mark下,讲得非常好   http://rishy.github.io/ml/2015/07/28/l1-vs-l2-loss/    参考:https://baijiahao.baidu.com/s?id=1603857666277651546&wfr=spider&for=pc 

2018-12-24 10:45:13 30707

原创 梯度下降中的学习率的作用

如图所示: 如果不用学习率或者说学习率为1,使用负梯度,即最速下降法,永远无法下降到最优值即0点处;作一次梯度下降,就移动相对称的点上;来来回回走;...

2018-12-19 12:07:42 2902

原创 时间序列的异常值处理

问题描述:开盘价的日收益率出现了异常值,9000多倍,什么原因导致?答案:如图所示:由于开盘价出现了异常,价格为0.01;导致以此价格为基础计算的相关指标均异常;如果要还原真值,如果用均值与中位数均不合理,个人有两个方案还原,方案一、前后的值取中间值,即前一个开盘价格与后一个开盘价格的均值;方案二、由于开盘价与收盘价相关性非常强,且正相关,补值的价格=当日收盘价格/昨日收盘价*昨日开盘价...

2018-12-18 17:29:50 13421

转载 kaggle竞赛--房价预测详细解读

## Kaggle竞赛 —— 房价预测 (House Prices)#### 完整代码见[kaggle kernel](https://www.kaggle.com/massquantity/all-you-need-is-pca-lb-0-11421-top-4) 或 [Github](https://github.com/massquantity/Kaggle-HousePrices)...

2018-12-17 17:45:49 1383

转载 kaggle较好的竞赛经验

【干货】Kaggle 数据挖掘比赛经验分享 (转载)标签: 数据挖掘数据科学家机器学习kaggle2017-05-21 19:25 99人阅读 评论(0) 收藏 举报本文章已收录于:分类:算法学习作者简介 Kaggle 于 2010 年创立,专注数据科学,机器学习竞赛的举办,是全球最大的数据科学社区和数据竞赛平台。笔者从 2013 年开始,陆续参加了多场 Kagg...

2018-12-17 14:26:39 2896

原创 garch模型-面试

1、garch模型的基本假设?     答:garch模型本质上是为时间序列的波动率而建模的,是对时间序列增加一个动态方程,来刻画资产收益率的条件异方差随时间的演变规律;基本假设是扰动项是不存在序列(历史数据)相关性,但是不独立的,扰动项可以用其平方项来描述;2、garch模型输出什么?     答:单独的garch模型输出当期的扰动项的值;3、条件异方差性的中异代表什么?  ...

2018-12-17 10:18:05 6971

原创 gbdt如何处理多分类问题(multiclass,cart)

本人理解:多分类变成多个二分类,比如说当前类别A,训练集的标签为属于A的为1,其他为0,该值为连续值(概率),基于这所有的样本生成一棵树;结果为对类别A的预测值f(x);然后B标签,C标签同理可得;然后通过softmax层处理下得到属于各个类别的概率值;这里每一轮迭代都会和类别数目相同的树;每一棵树针对一个类别进行学习并输出对应的分数,然后就n个类别的分数,经过softmax层变成概率...

2018-12-11 17:44:20 5007

原创 gbdt学习率调参

问题:如果你的梯度集成模型过拟合了,此时应该是增加学习率还是减少学习率?在梯度提升模型中,学习率本质上是误分类样本的权重;如果要减少过拟合,就要减少对错误分类的关注;此处使用极限思维,学习率为0,那么就只有一棵树,错误分类的实例均不考虑;输出验证集与训练集的结果:改变学习率:输出结果:如下所示:降低了学习率,减少了过拟合,泛化性能提升...

2018-12-11 14:35:29 4380 1

原创 lr与svm如何选择-面试

我当时的回答:如果要求不仅仅是类别,输出概率水平大小,要选用lr;因为svm只输出类别;网上总结异同:svm是结构风险最小化的函数,因为自带L2正则函数;svm中取决于支持向量,所以与数据分布无关,而且计算依赖于距离公式,所以标准化很重要; lr的决策 平面取决于所有的数据,所以依赖于数据分布,由于是概率公式,所以可以不需要标准化;  ...

2018-12-11 10:38:35 1030

原创 lstm解决梯度消失

本人认为:lstm只能缓解梯度消失,并不能完全解决;因为最新的状态单元可以是过去的一个线性组合,过去的信息传递到现在主要是由每个时间步的遗忘门参数连乘决定的;而rnn是过去时间序列的一个连乘;由参数w与tanh激活函数的导数值连乘而得到的;   ...

2018-12-07 17:07:21 2240 1

原创 tensorflow 实现 logistic regression

import numpy as npimport matplotlib.pyplot as pltimport tensorflow as tf#prepare datadataX=np.random.randn(1000,15)dataY=np.random.randint(0,2,1000).reshape(1000,1)X=tf.placeholder(tf.float32,s...

2018-12-06 16:51:25 260

转载 最大熵模型的理解

个人理解:最大熵模型的本质就是对未知的东西进行均分;           

2018-12-06 14:07:13 214

转载 L1相对于L2较稀疏的原因

 

2018-12-05 14:57:02 305

原创 自己对ols推导

最终的结果跟假设息息相关,比如说x是列向量还是行向量,最终的X是什么维度,Y是什么维度都会影响最终的表现形式;但万变不离其宗,掌握本质其他一切都是外在表现形式不同而已; 为了以后计算简单方便,我自己设定以后 统一用列向量;...

2018-12-04 11:20:19 1998

化繁为简之Python代码

将文本中的繁体字均转化成简体字,语言为python,可供文本处理的数据科学家使用

2019-04-11

centos7.6所需gcc以及相应所有的包

为最新的centos系统提供安装gcc与相应的安装包,为离线安装节约大量的搜索与下载的时间

2019-03-17

Training deep network without learningrate coinbet

深度学习需要通过调节大量算法参数来获得最好的结果;其中就包括学习率的人为调节;该文档使用了coinbet算法,令学习率不需要再人为的设置

2018-11-14

stacked Denoise autoencoder learning useful representation

该论文主要论证了无监督学习sdae算法的有效性,该算法极大的降低了SVM分类算法的分类损失值;缩小与DBN差距,某些方面甚至超越DBN

2018-11-14

深度学习+tf

涉及深度学习各个领域,包括三大类框架CNN.RNN MLP;都是使用tensorflow实现的;还包括深度学习推荐算法;是一个学习tensorflow和深度学习实践的好文档

2018-11-14

使用自编码器与lstm预测金融时间序列

首先、wt(小波分析)过滤噪声 然后 saes(自编码器)提取强特征 最后用lstm进行学习训练

2018-04-18

长短期记忆时间序列预测金融市场

很好的描述了如何将人工智能之循环神经网络运用于金融之股票市场的预测,包括特征处理,标准化,结论,与传统机器学习的效果进行比较

2018-04-18

人工智能选股之Python实战

人工智能选股模型如何用python完成,即用python实现机器学习模型

2017-12-21

人工智能选股之朴素贝叶斯模型

人工智能选股之朴素贝叶斯模型主要讲解概率模型的股票交易市场中的应用,值得学习与借鉴

2017-12-21

基于机器学习的股票排名方法

传统的机器学习运用于选股的论文,对于量化研究爱好者可以借鉴与参考,

2017-12-21

FAMA-FRENCH

FAMA-FRENCH

2017-08-03

Python_Machine_Learning_By_Example

Python_Machine_Learning_By_Example

2017-08-03

BayesiOptimization

贝叶斯优化

2017-08-03

Advanced_Algorithmic_Trading

python版的算法交易

2017-08-03

统计思维:程序员数学之概率统计

统计思维:程序员数学之概率统计,程序员用统计学研究问题可以参考的!

2015-12-16

R语言获取国内的股票数据

直接用getSymbols能方便的获取国外的,但不能方便的获取国内的,代码经过检验可以直接获取国内股票日线数据

2015-12-16

将CSV格式转换成xts,zoo时间序列格式

R语言自己从网上downloadR数据是时间序列格式,但读取到的CSV格式并不是时间序列格式,这个代码经过验证,在需要的可以试试

2015-12-16

Rbreak日内交易策略

这个网上有现成的,这个作用还是挺大的,但是需要手动改改才能运行!

2015-12-16

c#学校网络断网自动重连

每10秒就会检测网络连接是否正常,如果断开,就会发送POST数据。

2015-04-10

pku 2371 快速查找法very easy!

这是pku里面一个比较容易的一个题目!快速查找法qsort里面的利用是最重要的!

2009-12-22

黑客零起点网络手册.chm

黑客零起点网络手册,要成为黑客就得从这里学起!加油吧!

2009-05-29

linux系统---linux命令.rar

linux系统---linux命令快快来下载啊,不容错过!

2009-05-29

容斥原理理论和鸽巢原理

非常难的一个算法,好好努力吧!快快来下载啊!

2009-05-29

算法分析与基础---蛮力法

这是算法中的一个非常实用的算法;格式为ppt格式;大小为99kb;

2009-05-29

银行模拟系统---简单方便

该系统具备普通银行系统功能,例如建立账户,存款和取款,查询;

2009-05-29

关键字图书馆管理系统

这是一个通过建立关键字索引表来完成图书查询的一个系统;

2009-05-29

servlet2.4.pdf

java servlet specification

2009-05-29

ASCII超级方便的查询器

此是一个可以方便我们查询ASCII的程序!

2008-09-08

十大利用矩阵乘法解决的经典题目

十大经典矩阵算法,此文本是pdf格式!c++语言程序

2008-09-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除