stata统计分析及行业应用案例分析_数据分析之路(二)——描述性统计分析和应用案例...

本文介绍了Stata中描述统计分析的基本概念,包括平均值、四分位数、标准差和标准分,并探讨了它们在数据分析中的应用。平均值作为数据集中趋势的指标,易受异常值影响。四分位数用于识别异常值,IQR(四分位距)结合中位数定位异常值。标准差衡量数据波动,变异系数用于比较不同数据集的稳定性。标准分则将数据标准化,方便比较。文章还提到了异常值的处理策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.描述统计分析

将一系列复杂的数据减少为几个能够起到描述作用的数字,用这些代表性的数字来代表数据集,进而知道数据的整体情况。

常用的4个指标:①平均值;②四分位数;③标准差;④标准分

1.1 平均值

表示一组数据集中趋势的指标,指在一组数据中所有数据之和再除以这组数据的个数。

缺点:平均值对异常数值不敏感,当数据中有异常值时,用平均值来描述数据整体情况是不准确的。

1.2 四分位数

中位数:将数据集有n个数值,按从小到大进行排序,如果n是奇数,中位数是位于中间数值;如果n是偶数,中位数就是中间两个数的平均值。

四分位数:下四分位数的位置= (n+1) × 0.25

中位数的位置= (n+1) × 0.5

上四分位数的位置= (n+1) × 0.75

用箱线图来理解四分位数:

aaa0974c6dcf1ba6c86796d5f9a75561.png

四分位数的应用:比较数据;识别异常值。

异常值:

Stata中,可以使用`by`命令对数据进行分组,并使用`summarize`命令计算每个分组的描述性统计量。下面是一个示例代码: ``` sysuse auto, clear by foreign: summarize mpg weight length rep78 ``` 这个代码将根据`foreign`变量对数据进行分组,并计算每个分组的`mpg`、`weight`、`length``rep78`的描述性统计量。你可以根据需要修改变量分组条件。 引用\[1\]提供了一个将描述性统计量输出到Word文档的方法,你可以参考该引用中的代码来实现。需要注意的是,你需要先安装`sum2docx`命令,该命令可以通过在Stata中运行`ssc install sum2docx`来安装。 引用\[2\]提供了关于`stats()`选项的详细说明,你可以根据需要设置输出的统计格式。 引用\[3\]提供了关于描述性统计分析的基本原理应用的介绍,你可以参考该引用来理解描述性统计的概念计算方法。 #### 引用[.reference_title] - *1* *2* [命令更新之sum2docx:将描述性统计输出至Word文档 ——转自李春涛老师团队 爬虫俱乐部 微信公众号](https://blog.csdn.net/yexiaobu/article/details/108875939)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [stata统计分析行业应用案例分析_描述性统计分析应用——基于描述性统计分析识别优质股票...](https://blog.csdn.net/weixin_39796140/article/details/110255562)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值