自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

yugao1986的专栏

SAS and R 学习记录

  • 博客(181)
  • 资源 (10)
  • 收藏
  • 关注

转载 SAS For Mixed Model

This book you can be achieved from google.ContentsPreface ixChapter 1 Introduction 11.1 Types of Models That Produce Data 11.2 Statistical Models 21.3 Fixed and Random Effects 41.4 Mixed

2011-11-21 21:26:50 3721

原创 层次分析法步骤

AHP分析方法,其基本步骤可归纳为:(1)建立递阶层次结构建立递阶层次结构是AHP法中关键一步,如图所示。首先,把复杂问题中所包含的因素分解为不同层次。同一层次的因素作为准则对下一层次的某些因素起支配作用,同时,它又受上一个层次因素的支配。这种从上到下的支配关系形成了一个递阶层次结构,处于最上层的是目标层,一般是分析问题的预定目标,本文中即以经济承载能力作为目标,以综合指标表示经济承载能力

2011-11-14 15:35:09 7008

原创 贪心算法(greedy algorithm)

关于贪心算法的概念、原理这里不想多提,可见百度http://baike.baidu.com/view/298415.htm 。因为是刚刚接触,所以并没什么特别的理解,但因为对C,C++等语言并不了解,这里姑且试着用SAS做两道题。题1:100元,50元,20元,10元,5元,2元,1元。你可以假设每种钱币的数量是无限的。现在有一笔交易,需要找个客户m元,请你设计一个算法,使得找给顾客的钱币

2011-11-11 20:31:46 4139

转载 Analyzing Time Series Cross-Sectional Data with the PANEL Procedure

INTRODUCTIONIn recent years, estimation techniques that use time series cross-sectional (panel) data approaches have become widely used. The PANEL procedure in SAS/ETS software fits classes of linea

2011-11-07 21:53:49 2567

原创 sas/iml矩阵算术

这样的资源网络上是有的,不过大都是英文,这里姑且进行一些拾牙慧,用汉语进行标注。1.行列式*行列式特征;proc iml; reset print log; A = {3 1, 2 4}; r = det(A); *行列式的值; r = det(A[{2 1},]);*交换行列式的行行列式变号; r = det(A[,{2 1}]);*交

2011-11-06 13:41:25 10580

原创 卡方随机数

1.利用RANGAM,这种方法的原理是利用概率的逆运算。我们知道卡方分布是特殊的伽马分布,伽马分布的形状参数alpha=n/2,尺度参数l=0.5时,它就是自由度为n的卡方分布,故可以通过RANGAR生成卡方随机数例如:我们生成自由度为3的卡方分布,100个随机数data a; do i=1 to 100; Ch = RanGam(121212,3/2)/(0

2011-11-03 22:23:53 4391

原创 SAS中的HASH语句及其常见应用

首先,应用HASH有以下几点优点• Key lookup occurs in memory, avoiding costly disk access.• When a key lookup occurs, only a small subset of the records are searched.• The key and data parts of a record can co

2011-11-02 22:06:26 9906

原创 二项分布比例的置信区间计算

之前一网友遇到类似问题,特查了相关文献,归结一下方法有二。1.根据各方法的计算公式进行编辑公式,data 步就可以搞定。相关文献有:《A Comparison of Binomial Proportion Interval  Estimation Methods 》、《Confidence Interval Calculation for Binomial Proportions》,这两篇文章

2011-10-27 21:43:27 25201 1

转载 Multivariate Data Plots

Why plot data?1)     Plotting your data should usually be the first done once a data set is ready to be analyzed.  The purpose is toa)    Look for trends b)    Discover unusual observations (out

2011-10-26 11:14:36 1324

转载 SAS FUNCTIONS

SAS FUNCTIONSExcerpted from SAS release 8.2 Online DocumentationJuly, 2004Arithmetic FunctionsABS(argument)returns absolute valueDIM(array-name)returns the number

2011-10-25 08:59:09 1641

原创 素数的sas实现

1.DATA STEPdata tmp(drop=i); n=2; output; do n=3 to 10000 by 2; do i=2 to n-1; if mod(n,i)=0 and i^=n-1 then leave; if i=n-1 then output; end; end;run;proc print;run;2.ma

2011-10-21 22:03:50 2719

原创 将单独的图形列在同一张图上---ODS

FROM  样本数据:data spiral; do theta=1 to 1080 by .1; r=.75 + sin((.25*theta)); x=r*cos(theta); y=r*sin(theta); output; end;run;data star; do theta=

2011-10-18 16:36:45 823

原创 Creating a data step view

http://blog.renren.com/blog/220869953/732200049?from=fanyeOld THE details are from SAS Programming III :Advanced Techniques 1 DATA State

2011-10-17 20:24:59 714

原创 因子分析过程

http://blog.renren.com/blog/220869953/729589635?from=fanyeNew Factor因子分析过程因子分析用少数起根本作用、相互独立、易于解释通常又是不可观察的因子来概括和描述数据,表达一组相互关联的变量。通常情况下,这些

2011-10-17 20:19:49 7122

原创 股票价格累积概率分布

sample.txt为上证指数 ,读入sas.filename in 'c:\sample.txt';data a; infile in dlm='09'x; input id date : yymmdd10. (x1-x7) (: $12.) ;

2011-10-17 20:17:10 1391

原创 sas中的随机数发生器

http://blog.renren.com/blog/220869953/729109705?from=fanyeNew                             Random Number Generator Functions Available in S

2011-10-17 20:09:11 5524

原创 相关系数

http://blog.renren.com/blog/220869953/728359353?from=fanyeNew1.Pearson相关系数proc corr data=sashelp.class pearson cov;   var age height w

2011-10-17 20:02:29 582

原创 主成分分析

http://blog.renren.com/blog/0/726893170/editBlog 一、关键词:主成分分析思想:降维信息量:第一主成分,第二主成分,.....模型:矩阵方程或线性方程组方程条件:主成分系数平方和为1,主成分间独立,主成分的方差递减

2011-10-17 19:58:35 1323

原创 Monte Carlo Simulation

A.STEP,(FROM《SAS For Monte Carlo Studies》)1. Designing the system (What are the parameters of the system? What are the relationships among

2011-10-16 22:34:47 1065

原创 相关系数与协方差间的转换

首先,相关系数和协方差间的数学关系为:其次,上述数学表达式在sas/iml中的算法表达如下,R为相关系数矩阵,S为对角阵, COV协方差矩阵其中: 最后,上代码:***** Program 4.10 PROC IML ***********;*

2011-10-16 20:40:35 15396

转载 iml回归

FROM 《SAS/IML USER'S GUIDE》 /* 已知X,Y,利用最小二乘法估计回归方程Y=XB+E */*ods trace output;proc iml;start reg; n = nrow(x); /* 观测值数目 */ k =

2011-10-14 21:37:16 1402

转载 SAS programming for spatial problems

The programs here are for people who like SAS, geography and geographic information science. Most of this stuff isn't purely statistical, bu

2011-10-13 11:18:51 482

原创 矩阵散点图

/*proc corr*/ods graphics on;proc corr data=sashelp.stocks plots=matrix(histogram); ; var open high low close adjclose ;run;ods graphics off;/*sgscatter*/title 'Scatter Plot matrix';

2011-10-12 22:14:06 4194

原创 灰色预测GM(1,1)模型实现IML & R

虽然相关文章都会提及GM(1,1)模型,但是感觉都没有刘思峰的《灰色系统》书中第六章讲的详细。下面利用矩阵语言算法实现,代码经校对后衔接了中国卫生统计中的两篇文章。/*颜 杰 2006 中国卫生统计*/data a1;INPUT t year xt@@;/*读入原始数据序列*/ yt+xt;/*生成一阶累加序列*/ index=1; zt=-(yt+LAG(yt

2011-10-11 14:34:48 8254 4

原创 Splitting a Huge dataset to smaller datasets

http://communities.sas.com/message/102641#102641 http://bbs.pinggu.org/forum.php?mod=viewthread&tid=886738&page=1#pid9952820http://bbs.p

2011-10-11 10:42:21 830

原创 箱线图

箱线图可以直观表现数据分布的特征,它在描绘属性数据上有着自己独特的优势,比如可以数据集中、分散、偏态、异常等情况。箱线图与描述统计中的最大、最小、分位数等密切有着密切的关系,箱线图正是利用这些统计量来呈现数据的离散集中情况。网络上将箱线图的绘制划为5个步骤:       (1)画数轴   (2)画矩形盒 两端边的位置分别对应数据的上下四分位数矩形盒:端边的位置分别对应数据的上下四分位数

2011-10-09 10:18:37 1832

转载 Volatility and ARCH Models

------Dr. Junsoo Lee Why Volatility clustering?  What are the issues?·        Time varying risk premia·        Heteroskedastic var

2011-10-07 21:29:47 1630

转载 BOOTSTRAP RESAMPLING DISTRIBUTIONS OF THE MEAN WHEN THE CENTRAL LOCATION PARAMETER IS KNOWN

——— Peter M. Saama作者分别利用Mathematica、sas/iml、splus及stat完成该bootstrap实验,这里摘录仅sas/iml代码。值得强调的是,它属于percentile-bootstrap。1.主要算法步骤a) Define p

2011-10-07 17:18:47 662

原创 统计模型检验

今天阅读了一篇名为《Estimation of Statistical Models in SAS》的文档,文如其名,该文对不同的统计模型检验进行了概括,其中包括普通最小二乘回归(OLS)、分位数回归(QR)、稳固回归(RR)、嵌套对数模型(NLM)、泊松及负二项模型(PANBM)、非参和半参数估计(NASE)、偏最小二乘(PLS)、联立方程(SOSE)、似无关回归(SUR)、Tobit回归和截断

2011-10-04 20:47:24 2729 1

转载 Pros and Cons of X command vs. SYSTASK command

ABSTRACTMoving and managing files across a network can be easy or sometimes challenging. There are a few ways to copy and move files acros

2011-10-03 12:14:48 1151

原创 节日快乐

节日快乐  DATA _NULL_; /*Initialize DSGI*/ RC = GINIT (); /*Open a graphic segment*/ RC = GRAPH ('CLEAR'); /*Assign

2011-10-01 20:32:25 487

原创 统计过程控制图SPC(2)

上篇文章提及的统计过程控制图是单一变量的控制图,它属于单值控制图。控制图的种类很多,我的老师在其书中如是分类:(1)计量控制。对于产品的物理度量指标,如机器零件的尺寸,棉卷的重量,青砖的抗压强度等,在生产过程处于控制状态时,产品质量服从正态分布。根据这种指标进行抽样控制叫计量控制。常用的计量控制图有:单值控制图(即x控制图)、平均值控制图(即 控制图)、极差控制图(即R控制图)、中位数极差控制

2011-09-29 21:38:59 4365

原创 直方图、正态分布图与SPC图

统计过程控制图(Statistical Process Contol,SPC)就是应用统计计算对生产过程中的各个阶段所搜集的产品数据进行统计分析,依据产品质量标准,调整生产过程,从而达到改进产品质量的目的。有些书籍称其为管制图。SPC从图形上看也有个过程,就是从直方图,到正态分布图,再到SPC图的发展过程。1.直方图直方图就是将所收集的数据.特性质或结果值,用一定的范围在横轴上加以区分成几

2011-09-28 14:28:56 19049 1

原创 茎叶图

茎叶图可以很好地汇总数据,清晰地显示数据的等级顺序及数据的形状。它主要又茎和叶构成,利用竖线将茎叶隔开,竖线左边为茎,右边为叶。由于构建茎叶图时,通常将数据根据数据的位数进行分割,所以它的优点之一就是它可以完整保留数据信息。以两位数为例,可以将十位数设为茎,个位数设为叶。另一方面,也可以使用多个茎,三位数的数据就可以使用两个茎。可以看见,数据量很大的时候,茎叶图很难容下全部数据。例如:

2011-09-27 15:31:33 2561

原创 qq图

假设有一个n个观测的样本,需要检验它是否来自一正态总体,qq图是检验正态性的一种方法。qq图原理如下:我们将观测值进行排序x1=服从正态分布的情况下,经验分布函数F(X)就可以通过相应的转换与标准正态分布联系起来:F(X)=,由此建立x与u和6的关系式在平面上作点(u,x),如果n个点近似在一条直线上,就认为它们来自正态总体。例如,我们利用sas软件来检验一组数据的正态性,下面数据

2011-09-26 15:41:42 1418

转载 读取文件问题

tianwild在其日志中做过详细的记录,题为《读取文件夹下所有相同文件》,链接为http://www.mysas.net/sns/index.php?app=blog&mod=Index&act=show&id=1834&mid=43恰巧,mysas论坛上有一问,不

2011-09-23 21:34:35 1090

原创 Reading "Using SAS/IML to Generate Weighted Chi-Square Statistics"

这篇文章逻辑性很强,脉络清晰,这样的思维能力就是所谓的逻辑了吧.文章将计算加权卡方统计量分作12个小环节,具体如下:1.设定矩阵假设存在一药物作用的患者样本,它有K(1,2,...,K)个观测,两种(i,j)处理,,将所有观测数据写成矩阵形式,就可以得到一个K*2的矩

2011-09-19 11:49:33 861

转载 Some examples about perl expression

详见:http://www2.sas.com/proceedings/sugi29/265-29.pdf ***Primary functions: PRXPARSE, PRXMATCH;/*Program 1: Using a Perl regular expres

2011-09-16 16:02:43 714

原创 缺失值简单插补方法

1.利用均值/最小值/最大值等进行插补PROC SQL noprint; create table sample as select * ,CASE _value_ when . then MEAN(_val

2011-09-08 10:39:55 3344

原创 An Overview of Survival Analysis using Complex Sample Data

http://support.sas.com/resources/papers/proceedings11/338-2011.pdf

2011-09-06 19:04:44 498

朴实贝叶斯算法

朴素贝叶斯算法,c/c++语言的 它能提供比非泛型强类型集合更好的类型安全性和性能。

2011-11-13

id3算法ppt

id3算法,适合初学者。免费分享,欢迎下载

2011-11-13

java提高级讲义

文档来自中科院计算所培训中心讲义,适合有一定java基础的并期望提高的同学

2011-09-20

中科院c++讲义

文档系中科院计算所培训中心讲义,课件内容

2011-09-20

Guide to Report Writing Examples

基于sas软件的报告设计,该书里面有很多例子,这些例子都是日常工作常遇到的问题

2011-07-26

100 Statistical Tests(the third edition)

介绍100种统计检验,包括各种常用的假设检验

2011-07-26

数据分析方法(数据挖掘与统计学结合)

该书介绍了各种数据挖掘分析的方法,容易上手,适合初学者。

2011-04-30

sas for mixed models

该书详细介绍了各种复杂的统计模型,给出了sas软件对此进行处理的方法。

2011-04-30

sas的EM模块范例

该文件主要是介绍了SAS的EM模块的例子,其中有html格式的文字说明,对照学习。

2011-03-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除