人工智能
量化橙同学
好好记录就是对曾经的负责,是对生命的珍视,对价值的保护,对勤奋的肯定,对灵魂的忠诚!
展开
-
python学习——如何运行python脚本不使用python 指令
如何运行python脚本不使用“python”指令原创 2023-01-12 13:11:02 · 340 阅读 · 0 评论 -
python学习——总结sklearn中的几个参数优化器
python学习——总结sklearn中的参数优化器原创 2022-10-26 12:53:09 · 1573 阅读 · 0 评论 -
自然语言处理——综述
自然语言处理的四个过程:1:把需要研究的问题在语言学上加以形式化,使之呢萌购以一定的数学形式,严格而规整的表示出来2:把这种严密的规整的问题在语言学的形式上加以形式化,使之能以一定的数学形式,严密规整的表示出来3:根据算法编写计算机程序,在计算机上加以实践出来4:对于建立的自然语言处理系统进行评测,使之不断进行改进质量和性能,满足用户的需求自然语言处理模型需要的不同平面的...原创 2021-08-17 10:30:08 · 624 阅读 · 0 评论 -
量化投资学习——限价订单簿研究综述
限价指令簿描述性研究概述随着限价指令簿数据可获得性增强,许多学者开始对限价指令簿进行描述性 实证研究。Biais、Hillion 和 Spatt(1995)对巴黎股票交易所的限价指令簿和订单 流特征进行了详尽的实证分析,是指令簿研究领域的经典文献,其主要发现包括: 最优报价处的指令簿斜率较陡,指令簿上的价格安排是弱凹的,近似线性;买卖 价差显著大于最小报价单位,表明价格的离散性具有内生性;价差...原创 2019-07-14 13:23:18 · 2228 阅读 · 0 评论 -
量化投资学习——Dealing with the Inventory Risk A solution to the market making problem
这篇论文是一篇高频交易做市的论文,怎么说呢,很难,部门leader给我的时候,我就发现很熟悉,原来是实验室小老板给过的很难的那篇,来来来,大家跟着我的思路,我们一起把这个论文扒一扒。AbstractMarket makers continuously set bid and ask quotes for the stocks they have under consideration. H...原创 2019-07-02 16:06:06 · 1022 阅读 · 1 评论 -
量化投资学习——高频交易数据建模方法·
大师的作品:Per Mykland在2005JASA上发表过一篇文章,专门讲过舍弃数据计算波动率也有遗憾,从底层随机建模开始,实现了一套方法,才把高精度数据安全用上。...原创 2019-06-26 10:58:01 · 2662 阅读 · 0 评论 -
量化投资学习——时间序列分析中的时频问题
这个文章呢,不是为了别的,是整理一下自己的一个想法,使用傅里叶变换来处理交易策略会不会有比较好的效果,众所周知,傅里叶变换是信号处理的一个利器,金融信号是不是也属于很多频率的信号,不同强弱的信号叠加的结果呢,这个文章先开着,下面会整理更多的资料来佐证我的这个假设...原创 2019-06-08 21:30:50 · 535 阅读 · 0 评论 -
量化交易(Quant)面试题——一类骰子问题
说明:文章来自从互联网上各个渠道以及我自己本人面试的收集和整理,如果您认为我触犯您的权益,请联系本人进行删除1、3次投骰子,期望是多少?给一个骰子,三次投掷机会.可以选择投掷一次就停止,也可以投2次,也可以投三次.你将得到最后一次投骰子获得点数的钱.如,你只投一次就停止,得到6,那么,数学期望是多少,如何设计一个合适的策略取得最大的收益?答案:每投一次的期望值是(1+2+3+4+5+6...原创 2019-06-08 16:01:05 · 6793 阅读 · 1 评论 -
量化投资学习——Boost多因子选股综述
最近毕设的课题选择是xgboost多因子选股,看了很多的文献首先第一个:《TS-Boost因子选股框架初探——机器学习实战系列之一》长江证券这篇研报的特点,是提出了一个新的模型,TS-Boost模型的特点是在于解决样本非同分布的问题(文中是这么说的),什么叫样本非同分布呢,众所周知,在多因子选股里面有两个非常著名的名词,一个叫面板回归,一个叫截面回归,顾名思义,就是一个输入的是全部股票的...原创 2019-05-12 11:29:05 · 3340 阅读 · 0 评论 -
python数据处理——回归模型的误差分析
首先是提供各个比较好的来源,有空了我再写一个我自己整理的版本出来可以参考简书上的:回归评价指标MSE、RMSE、MAE、R-Squaredhttps://www.jianshu.com/p/9ee85fdad150...原创 2019-04-25 11:39:13 · 4768 阅读 · 0 评论 -
量化投资学习——因子IC、IR的介绍
因子IC、IR的介绍:IC即信息系数(Information Coefficient),表示所选股票的因子值与股票下期收益率的截面相关系数,通过 IC 值可以判断因子值对下期收益率的预测能力。信息系数的绝对值越大,该因子越有效。IC为负表示因子值越小越好,IC为正表示因子值越大越好。IC的计算方法是:计算全部股票在调仓周期期初排名和调仓周期期末收益排名的线性相关度(Correlation)。I...原创 2019-04-16 09:23:44 · 62051 阅读 · 1 评论 -
量化投资学习——一些牛比的量化投资公司
Jane StreetJane Street是华尔街最神秘的交易公司,以关注科技和股票交易而闻名,去年他们总交易额达到了5万亿美元。Jane Street公司成立于2000年,目前拥有600多名员工,每天股权交易量高达130亿美元。有消息人士透露,Jane Street其实从去年开始就“低调”进入了加密市场,他们可能是受到了美国资本高频交易公司DRW的启发,后者在2014年通过旗下子公司...原创 2019-04-15 17:00:01 · 2142 阅读 · 0 评论 -
python数据处理——样本数据类别不平衡
keras已经在新版本中加入了 class_weight = 'auto'。设置了这个参数后,keras会自动设置class weight让每类的sample对损失的贡献相等。例子如下:clf.fit([X_head_train,X_body_train], y_train_embedding, epochs=10, batch_size=128, class_weight = 'auto'...原创 2019-03-11 14:48:25 · 1444 阅读 · 0 评论 -
python数据处理——numpy矩阵操作,取其中的一行或一列
>>> import numpy as np>>> a = np.array(9).reshape(3,3) 另外再重申一下构建一个初始化的矩阵的办法:如下面这个构建一个从0到8的3*3矩阵>>> a = np.arange(9).reshape(3,3)>>> aarray([[0, 1, 2], ...原创 2019-01-17 12:32:15 · 10952 阅读 · 1 评论 -
金融数据时间序列分析——模型准确率过高怎么办
多少年后,小f想起了自己还是刚刚出道的小萌新时候犯的一个错误,当时模型的准确率贼高,高的离谱,就像下面这种情况 precision recall f1-score support -1 1 1 1 1934 0 1 1 ...原创 2019-01-10 17:58:33 · 2104 阅读 · 0 评论 -
量化交易文章阅读笔记——量化研究05|订单信号延迟方式对趋势策略绩效的影响
文章链接在此:https://mp.weixin.qq.com/s/gGQTkXAHv6rQObwb-plgmQ从这篇文章的数据可以作如下总结。(1)入场信号延迟会导致收益率下降,而最大回撤比率一般由出场信号决定的,所以入场信号延迟对最大回撤的减少效果不明显。(2)出场信号延迟对整体组合绩效提升明显,出场信号延迟可以有效减少最大回撤,因此导致了收益风险比的快速提高。这正如平常说的那句话,平...原创 2018-12-25 16:20:59 · 557 阅读 · 0 评论 -
tpot自动训练机器学习模型
tpot 自动训练模型包Consider TPOT your Data Science Assistant. TPOT is a Python Automated Machine Learning tool that optimizes machine learning pipelines using genetic programming.TPOT will automate t...原创 2018-12-10 12:00:46 · 1362 阅读 · 0 评论 -
机器学习模型评测:holdout cross-validation & k-fold cross-validation
cross-validation:从 holdout validation 到 k-fold validation2016年01月15日 11:06:00 Inside_Zhang 阅读数:4445版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/lanchunhui/article/details/50522424构建机器学习模型的一个...转载 2018-12-10 11:33:11 · 5442 阅读 · 2 评论 -
混淆矩阵
如有150个样本数据,这些数据分成3类,每类50个。分类结束后得到的混淆矩阵为: 预测 类1 类2 类3 实际 类1 43 2 0 类2 5 45 1 ...原创 2018-12-10 10:26:34 · 357 阅读 · 0 评论