题目: 某地 120 名男性红细胞数(blood)的数据(见程序中“BEGIN DATA”与“END DATA”之间的数据),此数据呈正态分布吗?(引自马斌荣主编书著,2001. P.150)
syntax 窗口编码如下:
* Ma Bin-Rong: SPSS for Medical Application,2Edit. 2001, P.150:.
DATA LIST FREE /blood.
BEGIN DATA.
568 460 500 580 560 434 561 570 519 645 563 552
540 541 461 501 581 620 573 518 562 597 551 574
480 481 542 462 502 584 517 637 580 547 521 442
564 575 482 543 463 503 585 572 541 525 495 523
634 532 565 483 544 464 504 559 587 494 522 448
526 618 595 577 484 545 558 505 493 586 622 524
456 576 527 490 579 557 546 466 506 572 533 450
566 528 491 567 556 465 485 547 588 507 589 535
596 492 569 555 578 513 530 486 548 534 508 588
628 526 554 531 512 570 514 521 487 459 590 509
END DATA.
NPAR TESTS /K-S(NORMAL)= blood /STATISTICS=DESCRIPTIVES.
DESCRIPTIVES VARIABLES=blood /STATISTICS=ALL.
FREQUENCIES VARIABLES=blood
/STATISTICS=ALL
/HISTOGRAM=NORMAL.
PPLOT /VARIABLES=blood /TYPE=Q-Q.
注: " *````` . " 在syntax中,表示注释的意思.
FREQUENCIES 语句用来描述频次;NPAR TESTS /K-S 语句是k-s检验,检验数据是否符合特定的分布。其中ORAML 表示检验的正态分布。 另:均匀分布是 UNIFORM ;泊松分布是 POISSON ; 指数分布是 EXPONENTIAL ; PPLOT语句生成pp图,检验正态分布与否。
代码执行后,结果如下:
结果分析:
Kolmogorov-Smirnov Test 的结果中, z 值等于0.532,p值等于0.940>0.5,因此数据呈近似正态分布。
Descriptive statics结果中,偏度系数Skewness=-0..33;峰度系数Kurtosis=-0.517;两个系数都小于1,可认为近似于正态分布。
QQ Plot 中,各点近似围绕着直线,说明数据呈近似正态分布。
结果思考:
检验数据的正态性,方法有很多,k-s test,descriptive,qq plot 等方法都可以检验数据的正态性。