分析思维 第四篇:数据分析入门阶段——描述性统计分析和相关分析

本文介绍了数据分析入门阶段的基础知识,包括认识变量和数据的分类,如定性、定序和定量变量,以及数据的处理方法如缺失值管理和重编码。接着,详细讲解了描述性统计分析的集中趋势(均值、中位数、众数)、离散程度(极差、方差、标准差)和分布形态(偏度、峰度)等概念。此外,还探讨了相关性分析,通过相关系数r判断变量间的相关程度,并解释了不同相关性的强度。
摘要由CSDN通过智能技术生成

数据分析的入门思维,首先要认识数据,然后对数据进行简单的分析,比如描述性统计分析和相关性分析等。

一,认识变量和数据

变量和数据是数据分析中常用的概念,用变量来描述事物的特征,而数据是变量的具体值,把变量的值也叫做观测值。

1,变量

变量是用来描述总体中成员的某一个特性,例如,性别、年龄、身高、收入等。

变量可以分为:

  • 定性变量:用于分类,一般是文本,例如,性别、颜色
  • 定序变量:用于表示等级或次序的变量,例如,学历,职位,排名等,变量的值可以把事务排列为高低或大小,但是各个变量值之间没有确切的间隔距离,无法确定两个定序变量之间相差多少。
  • 定量变量:是数量变量,能够比较大小。分为两类:离散变量和连续变量。

2,数据

数据是变量的具体值,按照变量的类型,可以把数据分为:分类数据、顺序数据和数值型数据。

按照数据分析的目的,可以把数据分为实验组(Treatment)和参照组(Control)。

按照数据的类型,可以把数据分为:文本数据、数值型数据和日期时间数据。

3,缺失值

不是所有的数据都是完整的,有些观测值可能会缺失&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

悦光阴

你的鼓励是我创作的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值