数据分析方法——第1章(1)

本文介绍了数据分析方法中的第一章节,主要内容包括一维数据的数字特征,如位置特征(均值、中位数、分位数)、分散性(方差、标准差、变异系数)和分布形状(偏度、峰度)。通过SAS 9.4软件进行了实例分析,如血清蛋白含量数据的统计分析,探讨了异常值的判断方法。
摘要由CSDN通过智能技术生成

一、背景

教材:数据分析方法 第二版 梅长林 范金城 编

软件:SAS 9.4(中文(简体))

二、内容目录

第1章 数据描述性分析

        1.1 一维数据的数字特征

                1.1.1 表示位置的数字特征

                1.1.2 表示分散性的数字特征

                1.1.3 表示分布形状的数字特征

三、正文内容

1.1.1 表示位置的数字特征

n个一维数据x_{1}x_{2},...,x_{n}——从总体X中观测得到的n个样本观测值,n为样本容量。

1.均值mean

数据中存在异常值时,均值缺乏抗扰性或稳健性,即易受异常值的影响而使其值有较大的变化。

2.中位数Median

受异常值的影响较小,具有较好的抗扰性或稳健性。

3.分位数

上、下四分位数:0.75分位数、0.25分位数

Q_{3}=M_{0.75}\bg_white Q_{1}= M_{0.25}

4.三均值\widetilde{M}

\bg_white \widetilde{M}=\frac{1}{4}Q_{1}+\frac{1}{2}M+\frac{1}{4}Q_{3}

SAS 程序通常分为数据步和过程步,一段SAS 程序根据目的和需要可以有0到多个数据步(Data)和0到多个过程步(Proc),还可以有系统选项语句、ODS语句等全局语句。

1.数据步(Data Step)

         以关键词Data 开头,可由多条语句构成,结束标志可以是空语句、Run 语句、过程步或下一步数据步。

         数据步功能有:
        (1)从外部文件中读取数据;
        (2)将数据写入到外部文件中;
        (3)读取SAS数据文件和视图;
        (4)创建SAS数据文件和视图。

 2.过程步(Proc Step)

        以关键词Proc 开头,可由多条语句构成,结束标志是Run或Quit 语句。

        过程步的功能有:
        (1)调用 SAS 过程(SAS Procedures)分析和处理SAS数据集形式的数据,或执行其他分析;
        (2)将分析结果以报表、图表的形式输出,或输出成 SAS数据集、外部文件;
        (3)生成SQL查询;
        (4)数据操作和管理。

proc univariate:对单变量做统计分析

例1.1 对某学校100名女学生测定血清蛋白含量(单位:g/L),数据如下:

74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.5
79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.0
75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.0
73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.5
75.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 70.4 68.0
70.4 72.0 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.3
73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.7
67.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.7
75.8 73.5 75.0 72.7 73.5 73.5 72.7 81.6 70.3 74.3
73.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5 70.4

计算均值,中位数&#x

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值