自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (1)
  • 收藏
  • 关注

原创 EXCEL基本功能 --- 文本函数

一、函数与文本函数函数:描述输入输出关系并实现这种计算关系的公式,如最简单的一元一次函数y=kx+b,输入x,就会输出相应的y,y的值是通过函数进行计算得到的。文本函数:对文本进行提取、查找、转换和更新的函数二、常用的文本函数MID函数:从文本字符串中指定位置开始,返回指定长度的字符串。操作流程:(1)点击公式-文本(2)点击MID函数(3)输入相关的参数(4)结果SUBSTITUTE函数:将字符串中部分字符替换为新字符串。操作流程:(1)点击公式-文本(2)点击S

2021-02-27 00:42:59 1833

原创 Excel基本功能

一、数据预处理包括四种工具:文本函数:对文本进行提取查找、转换、更新的函数重复项:对数据进行去重分列:拆分列数据数据排序与筛选:可以对数据进行排列和筛选二、核心函数库:统计包括四种函数:数学函数:SUM、AVERAGE,对数据进行计算逻辑函数:OR、NOT,对数据进行判断条件聚合函数:COUNT、SUMIF,对数据进行有条件的聚合引用函数:LOOKUP,从单行或单列或数组中查找一个值三、分析数据透视表、图表...

2021-02-26 20:22:52 1590

原创 数据分析 --- 数据分析的流程

做每一件事,都需要一定的流程,数据分析也不例外。下面,我将从我理解的角度介绍数据分析工作具体需要哪些工作流程:一、目标确定在数据分析之前,我们需要明确我们要解决什么问题,要达到什么目的,只有明确了目标,我们才能进行下面的工作。我们还要明确分析方式,我们是对现有情况进行分析,也就是描述性分析,还是基于现状,预测未来的情况,也就是预测性分析,这两种分析方式决定了我们接下来的工作步骤。二、数据获取在这一步我们需要进行字段设计,也就是根据第一步的目标确定到底要分析哪些指标,并确定相应的字段,以便进行分析。

2021-02-26 19:41:16 3581 4

原创 数据分析 --- 判定、处理异常值

一、为什么会有异常值异常值的产生大概可以分为以下三种情况:在录入数据的过程中产生了错误。在处理数据的过程中对数据错误添加。这些异常值是正确的并且真实存在的。二、如何处理异常值对于第一种录入错误,我们只需将其修改正确即可。对于第二种处理错误,可以将其删除,也可以填充空值或填充样本均值。对于正确且真实存在的异常值,我们可以根据实际情况调整数值并乘以需要调整的比率。...

2021-02-26 18:56:08 1522 1

原创 数据分析 --- 识别异常值

一、异常值的定义与平均值相差极大或极小的值,也叫离群点。异常值的判定要取决于分析的业务对象,如旅游业这种周期性产业。二、识别异常值观察检测值与整体数据的差异度,如计算与平均值的倍数。若异常值是合理的,那么其一定有其附加信息,也就是数据变动的原因,我们要对异常值产生的原因进行分析,以发现数据背后的现象。...

2021-02-26 18:45:24 807

原创 统计指标 --- 数据分布形态

一、意义数据分布形态,是指图表化数据后呈现的形态,有助于我们更好的理解数据的特征二、分类数据分布形态包括左偏分布、右偏分布、正态分布左偏分布:数据沿着x轴逐渐增大的趋势,如坚持努力学习后每次的考试成绩、人类的死亡年龄、资产的变化情况。右偏分布:数据沿着x轴逐渐减小的趋势,如人的运动能力,药物的有效性正态分布:数据集中分布于中间,两边较少,如人类的身高或体重、考试成绩的分布三、总结...

2021-02-23 00:13:25 10361

原创 统计指标 ---离散趋势指标

一、作用离散趋势体现了数据内部水平差异二、分类集中趋势指标包括极差、平均差、标准差极差:相距最远的两个点之间的距离,体现数据内部最大差异状况。平均差:一组数据各项与平均值之间的平均差异。平均差=(每个数据项-均值)后相加除以数据项的个数,平均差越大,数据越分散,对于事件驱动型数据,在样本量较小的时候容易导致误差,平均差对离散值更敏感。标准差:是优化后的更能代表离散程度的指标,能更直观的了解差异程度,是最常用的离散指标。标准差=(每个数据项-均值)平方后相加除以数据项的个数再开二次方三、总结

2021-02-22 23:20:26 6355

原创 统计指标 --- 集中趋势

一、作用集中趋势体现了数据的一般水平,可以用来快速了解样本数据的概况。二、分类集中趋势指标包括平均值、中位数、众数平均值:是最常用的集中趋势指标,但有弊端,单纯的计算平均值具有一定的误导性,对异常数据不敏感。中位数:按顺序排列后,位于中间的数。总数为偶数的数据的中位数为最中间的两个数相加除以二,中位数在这组数据中更具有代表性众数:出现次数最多的数值,反映的是局部特征密集度,众数可以有多个三、总结...

2021-02-22 22:56:38 5568

原创 SPSS 数据排序

一、数据排序数据排序的意义:数据排序在数据分析过程中非常重要,其便于了解数据的取值状况,SPSS可以对数据基于一个或多个个案(变量)进行排序。数据排序包括个案排序和变量排序,下面我将介绍这两种排序的操作方法。二、个案排序在进行数据分析时,若要按照某个变量的取值重新排列个案在数据文件中出现的先后顺序,可通过“数据”→“排序个案”实现。当存在多个 用于指定排序的变量时,数据首先按照主变量值的大小排序,然后对那些具有相同主排序的个案按照次变量值进行排序。1.点击 数据2.点击 个案排序3.选择排

2021-02-21 23:21:55 6782

原创 统计指标

一、统计概念:体现总体数量特征的概念和数值特点:根据数据分析目的的不同,统计指标也会发生变化二、统计指标的分类统计指标可分为:总量指标、平均指标、相对指标总量指标:就是特定条件下的总规模、总水平或总工作量,是一种最基本的统计指标。平均指标:就是某项数据平均值,显示了这项数据的一般水品,体现了数据的集中趋势。相对指标:是两个有联系的现象数值相比得到的比率,描述的是数值之间的相互关系而不是总体情况。具体包括比例、比率、倍数三种。类型计算方法意义举例比例各数据/总值

2021-02-21 22:13:28 1725

原创 数据、数据的分类

一、 数据是什么数据,是对事物的记录与描述。如气温,描述了当天的温度,让我们可以参考当天的气温决定今天穿什么;又如时间,作为一种尺度,标记了万事万物的活动,这些都是数据,可见数据是十分重要的。二、数据的特性我们可以将数字分为两种数据:1、定性数据:是文字性数据,如学号、身份证号等,无法计算比较,计量层次低。2、定量数据:是数字型数据,如汽车里程、消费金额等,可以进行计算比较,计量层次高。这两种数据也可以继续细分:如下图所示三、数据矩阵/二维数据表如EXCEL表格,pandas中的Data

2021-02-21 00:35:54 3448

SPSS 数据排序数据文件.sav

SPSS 数据排序数据文件

2021-02-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除