- 博客(181)
- 资源 (10)
- 收藏
- 关注
原创 R and MongoDB
R and MongoDBlibrary(RMongo)mg1 <- mongoDbConnect('test')print(dbShowCollections(mg1))query <- dbGetQuery(mg1, 'person', "{'age': 20}")data1 <- querysummary(data1)
2016-03-16 13:00:53 1838
原创 分类数据之logistic回归
/*分类变量分析之logistc(一),因变量为二分类变量数据coronary中ca为二分类因变量,sex、ecg为二分类自变量,所有的二分类变量用0、1进行区别,构成(0,1)矩阵*/data coronary; input sex ecg ca count @@; datalines;0 0 0 11 0 0 1 40 1 0 10 0 1 1 81 0 0 9 1
2013-09-30 15:46:43 7948 2
原创 分类数据之列联表分析案例with sas
*表一,随机设计四格表;options validvarname=any;data test1; input 用药 $ 敏感性 $ 计数; datalines;服药 不敏感 180服药 敏感 215未服药 不敏感 73未服药 敏感 106;proc freq data=test1 order=data; weight 计数; tables 用药*敏感性
2013-09-29 15:52:45 6133 3
原创 C基础笔记1
现代计算机之父: 冯.诺依曼计算机语言分类: 机器语言 汇编语言 高级语言:B语言系 C语言系(C,C++,C#,java,Perl,Python)C语言及标准化 最早由Dennis Ritchie于1973年为unix设计并实现,从贝尔实验室到世界各地 标准:
2013-07-24 22:11:15 2078
原创 java笔记1
From 达内JAVA基础一、java工具JDKjava开发工具包,sun官方提供的Java下载安装包,份操作系统和版本JREJava运行环境,下载安装JDK即可得到JRE,需要陪着环境变量JVMJava虚拟机,是java的核心功能的提供者,java程序必须运行在JVM中GC内存垃圾的回收机制,由JVM提供IDE集成开发环境,是大规模的商业开发工
2013-07-21 22:27:05 1951
原创 生成月度数据
data yu; data=.; do i=0 to intck("month",'01jan2013'd,"01jan2014"d); time=intnx("month",'01jan2013'd,i,"b");output; end; format time monyy.; drop i;run;
2013-04-13 18:46:54 2221
转载 哑变量矩阵生成dummy matrix with sas
FROM:http://support.sas.com/kb/23/217.htmlFor a specified model, there are several procedures that allow you to save the design matrix to a data set:For models using GLM parameterization (also
2012-11-28 00:02:56 4419
原创 Creditmetrics模型
维基百科里面有详细的介绍:http://wiki.mbalib.com/wiki/Creditmetrics模型。一、概况起来,其中主要的思想有:1.转换矩阵(Transition Matrix):它是一个信用等级的信用工具转移到另一个信用等级的概率矩阵;2.信用工具的在险价值VaR:信用工具的价值取决于其信用等级;3.信用计量模型的一个基本特点就是从资产组合并不是单一资产的角度来
2012-11-09 14:14:30 9034
原创 高低点比较、突破策略 using sas
/*俞高2012年10月15日1) 高低点比较策略通常人们判断趋势处于上升的理由是,当前低点比前一个低点要高,当前高点也比前一个高点要高。判断趋势处于下跌的理由是,当前低点比前一个低点要低,当前高点也比前一个高点要低。如果仅仅以高低点的比较去判断趋势的涨跌,这样的情况一天内会发出上百次而导致交易过于频繁。而且很多高低点之间的价格差距并不大,就是说,有时几乎没有上升,或者上升
2012-10-16 11:38:02 5005
原创 套利组合收益的节假日统计
需求:统计节假日效应:节前一周内开仓和节后一周内开仓的收益情况其中,套利组合在开平仓信号内,按照周一-周五分别开仓。解决步骤:1.数据处理1.1导入周一-周五组合的市值数据,组合数据包含开仓时间(start),平仓时间(end), 开仓市值(open),平仓市值(close),平仓沪深300市值(hs_close)。PROC IMPORT OUT= WORK.e
2012-10-15 15:29:10 2753
原创 读光大证劵“股指期货微观市场初探—高频数据、交易的解读”笔记
读光大证劵“股指期货微观市场初探—高频数据、交易的解读”笔记/*交易信号1: 根据每笔交易价格与交易前报价的关系确定此笔交易的触发方向,即买方触发还是卖方触发。 如价格与买一接近,则此单被定为卖单触发;如价格与卖一接近,则被定为买单触发。 如价格与买一和卖一距离相等,则不确认这单的触发方向。 */data trade_test1; set m_te
2012-09-27 16:47:10 3891
原创 过滤高频数据的微小波动using sas
*1) 均线化因为行情的日内高频价格序列波动比较剧烈,看起来也几乎是杂乱无章的,所以我们为了捕捉趋势需要过滤掉一些干扰的噪声,均线是过滤微小扰动的一种常用的方式,而且也适合用于捕捉趋势。我们将A 个连续的数据取均值,形成MA(A),在本文所作测试中A 取为10,下文都称经过均值化的数据位MA(10)。由于采用的原始价格序列是6 秒高频数据,所以均线化后的数据类似于60 秒价
2012-09-21 17:05:25 3494
原创 游程检验
*4)市场的有效性检验—游程检验:1) 对分笔成交价格的变化进行计数。当发生持续同方向变化时我们记这些持续的变化为一次连续;2) 统计样本内正向连续和负向连续的累积次数u。统计样本内正向变化次数n1和负向变化的次数n2。3) 如果价格变化是随机的,则发生连续的次数的期望值为:e=(2*n1*n2)/(n1+n2)+1,s=sqrt((2*n1*n2(2*n1*n2-n1-n2)/(
2012-09-20 14:22:41 4063
原创 完全复制沪深300指数
完全复制亦即购买标的指数中的所有成份股票,并且按照每种成份股在标的指数中的权重确定买卖比例,从而达到复制指数的目的。*主要步骤:*收集T日收盘价close,成份股权重weight,T日沪深300点位hs300;*成份股权重计算:根据分级靠当方法,计算成分股流通股本,流通市值, 最终得到成份股权重weight;*股票交易规则要求购买股票数量是100的整数倍,这里取法为:股票数量/10
2012-09-14 15:46:13 3836
原创 股票数据合并
一个月在论坛上提问过个股数据合并问题,问题如下:现有100只股票数据txt,命名形如:daysh600000,daysh600004...,daysz000001....,600000等是股票代码(id);数据的结构都一样,内含变量,date,open,high,close等,但不含股票代码:data daysh600000; input date open hight low
2012-09-11 13:33:41 2649
转载 Steps to implementing a scan loop in SAS
Steps:1. Store the number of observations in a data set to a macro variable (RECCOUNT)2. Increment a variable (I) fromone to RECOUNT using a %DO loop3. Use the FIRSTOBS option in a DATA step to
2012-09-07 22:51:25 2051
原创 Black Scholes期权定价模型
data BS; input S X r v T; d1 = (log(S/X) + (r+v**2/2)*T)/v/sqrt(T); d2 = d1 - v*sqrt(T); *编辑公式计算买权call和卖put的定价; C = S*cdf('Normal',d1) - X*exp(-r*T)*cdf('Normal',d2);
2012-08-17 11:30:44 4452
原创 动量策略&反转策略初探sas
MBAlib百科对动量策略和反转策略作了很好的解释:动量/反向策略是指买入赢家/输家组合,同时卖空输家/赢家组合的交易策略。其主要步骤为: ①确定目标证券市场作为交易对象的范围。 ②选定一个时间长度作为证券业绩评价期,通常称为投资组合的形成期或排名期。 ③计算形成期各样本证券的收益率。 ④根据形成期各样本证券的收益率的大小,对目标市场所有样本证券进行升序、降序排列,然后
2012-08-08 12:11:06 9530 7
原创 sas用于金融计算的函数
http://support.sas.com/documentation/cdl/en/lrdict/64316/HTML/default/viewer.htm#a003180371.htm重新整理了下:一些名词:Issue:证劵发行日;first-interest:证劵的第一个付息日;settlement:证劵清算日;rate:利息率;par:证劵的票面价值(sas中默认1000$)
2012-08-03 14:55:08 6483
原创 sas探索交易数据信息
长江证劵分析员做过题为“交易数据反映的信息及预测性”研究,见:http://www.docin.com/p-68475999.html。笔者试图套用文章的模型进行高频数据的研究:期货数据形如:....*读取主力合约数据;data test; set quote20120731; format date yymmdd10.; time1=input(tim
2012-07-31 16:41:38 2843
原创 图示期货价格变动对成交量的影响
*读取主力合约数据;data test; set quote20120725; format date yymmdd10.; time1=input(time,time8.); format time1 time8.; *10:00:00时间格式; hour=hour(time1); *提取小时; minute=minute(time1
2012-07-25 17:04:54 1651
转载 缺失值添加帖子汇总
https://communities.sas.com/thread/35155https://communities.sas.com/message/129069#129069https://communities.sas.com/message/109396#109396https://communities.sas.com/message/121311#121311https
2012-07-23 22:07:34 1009
转载 Comparing Stock Returns Forecasting Methods Using SAS
http://support.sas.com/resources/papers/proceedings12/163-2012.pdf文章比较了较传统的股票分析方法:移动平均MA,相对强度指标RSI,布连线;处于数据的连续和完整,文章选取1981.1.2-2010.12.31时间内纽交所都进行交易的股票数据,共计355只个股。数据包含了一下变量:日期date,股票的ID,日收益RET,股票调整价
2012-07-17 13:53:38 1260
转载 Portfolio Backtesting
转载,author:Xuan Liu, Mark KeintzAbstractOne of the most regularly used SAS programs at our business school is to assess the investmentreturns from a randomly populated set of portfolios coverin
2012-07-14 20:51:20 1852
原创 A股股票小参数计算
libname yu "E:\yugao\时间跨度相关\TXT";*sh600000数据测试;data test; set yu.tar(rename=(var1=date var2=open var3=high var4=low var5=close
2012-07-12 17:10:38 1045
原创 数据筛选first. and last.
/*期货数据筛选。期货数据包含:合约代码/行情日期/行情时间/各种价格等变量,期货数据结构较复杂。要筛选出指定日期相对应的合约,需要利用first. last.*/DATA GUZHI;*合并股指数据,对变量进行重命名,筛选出部分重要变量; set base.quote:(rename=(_COL2=fundid _COL4=open1 _COL9=high1 _COL10=low
2012-07-04 14:01:51 734
转载 表链接proc sql
朱世武的书的例子很详细,现在想想基本上涵盖了一些论坛上的问题./*21.1.1 简单连接*/proc sql;select * from resdat.china, resdat.usa;quit/*21.1.3 内部连接*/proc sql;select * from resdat.china, resdat.usawhere china.level=usa.level;q
2012-07-02 20:13:18 2550
转载 sas用于时间的函数
处理股票数据,经常要对时间变量作处理,特意摘录sas.support.com的样例来学习sas的用于时间的函数.另外《DATE HANDLING IN THE SAS ® SYSTEM》一文中也有很多详细的例子。*计算年龄;/* Create sample data */data birth; input name $ bday :mmddyy10.;datalines;
2012-06-23 22:11:56 6561
原创 比对沪深300成份股派息情况
/*目的:比对沪深300成份股派息情况细节:proc import读取沪深300成份股信息,从中财网提取A股派息情况(目前系统过粘贴成文本进而导入sas), 最后proc sql依据股票ID进行合并处理遇到的问题:在合并过程中会遇到两数据变量的属性不一致的问题,merge...by报错,proc sql结果多于300条记录*/*导入沪深300数据,该数据系20120
2012-06-21 15:41:25 3503
原创 派息与股价
//*源数据来自招商证据软件,fundid:股票代码,x系除权除息日开盘价与股权登记日收盘价的差值除以股权登记日收盘价,反应股价波动率y:派息率,派息金额与股权登记日收盘价比值*//;data test; input fundid $6. x y;cards;601288 -0.0375 0.044494382000031 -0.0166 0.0056
2012-06-21 14:45:38 1166
原创 实习流水帐
1.华泰柏瑞沪深300ETF申购赎回清单libname yugao "E:\yugao\work\htbr300ETF";data yugao.ht120531; infile "Z:\300_0531.ETF" dlm="|" firstobs=15 obs=300 lrecl=1024; retain fundid fundname fundnum cashrep
2012-05-31 17:51:03 1255
转载 异方差/自相关/多重共线性/协整
from:《金融计量学-基于SAS的金融实证研究》chapter4*异方差;proc reg data=capm.rip1outest=capm.beta;model meanrif=meanrmf;output out=capm.r r=e;/*把回归残差值赋给变量e*/by p;run;data capm.r;set capm.r;r2=e*e;
2012-05-29 15:38:37 3976
原创 proc rank
一个中文博客:http://blog.sina.com.cn/s/blog_6849f0730100we95.html排序方法详解(文档):Proc rank 计算 观测值对应数值型变量的秩次语法: Proc rank ; By variable-1 variable-n ;*分组变量; Var data-set-var
2012-05-28 15:42:46 2214
原创 经典线性回归拾穗
1.来历Francis.Galton,研究父母身高/儿女身高时,发现子辈身高趋向于全体人口的平均身高.该现象由其朋友Karl.Pearson证实.2.涵义研究因变量对自变量的依赖关系,试图通过自变量的确定来估计或预测因变量的均值.3.回归与因果因变量与自变量的依赖关系,并不一定意味着因果关系,从逻辑上讲,统计关系式本身不可能意味这任何因果关系.4.回归与相关相关是衡量变
2012-05-19 13:49:39 733
转载 sas时间序列试验指导(含程序)
实验一 分析太阳黑子数序列一、 实验目的:了解时间序列分析的基本步骤,熟悉SAS/ETS软件使用方法。二、实验内容:分析太阳黑子数序列。三、实验要求:了解时间序列分析的基本步骤,注意各种语句的输出结果。四、实验时间:2小时。五、实验软件:SAS系统。六、实验步骤1、开机进入SAS系统。2、 创建名为exp1的SAS数据集,即在窗中输入下列语句:data
2012-05-14 14:53:14 16485
原创 条件判别命令---ifc&ifn
if/else..where等条件判别语句比较常见,ifc&ifn语句的出现提高了某些条件判别的效率.这里从文档里翻译摘录些ifc&ifn的说明.1.语法:IFC(logical-expression, value-returned-when-true, value-returned-when-false value-returned-when-missing>);IFN(logi
2012-05-04 20:22:23 1249
原创 sas tips
1.查询每个月初数据(月底),利用intnx()函数,比较first.(last.)data stocks; set sashelp.stocks; by stock date notsorted; if first.date then output;run;data stocks2; set sashelp.stocks; by stock date not
2012-05-04 19:49:50 877
转载 Safely Merging Many Datasets
如题,该代码摘自“Safely Merging Many Datasets”一文,可以下载原文http://support.sas.com/resources/papers/proceedings11/409-2011.pdf/********************************************************A macro to safely merge al
2012-04-28 17:50:59 455
转载 sas做广义估计方程
赵目等在“纵向数据下广义估计方程估计”一文从数学角度对广义估计方程进行了探讨,这里转载个sas做广义估计方程的例子:data thall; input id y visit trt bline age; intercpt=1; cards;104 5 1 0 11 31104 3 2 0 11 31104 3 3 0 11 31104 3 4 0
2012-04-26 21:04:26 5354
原创 极差标准化方法&因子分析综合得分
1.极差标准化方法经济统计分析中对正负指标标准化的一种处理方法:sas计算:proc sql; create table new as select (x-min(x))/(max(x)-min(x)) as z_x, (max(x)-x)/(max(x)-min(x)) as f_x from mydata;quit;
2012-04-22 22:29:32 19315
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人