2.1.3工具篇-Excel——用Excel统计和分析数据

一、核心函数的实战运用

1. IF函数:条件判断的小能手

IF函数是Excel中最基本的逻辑判断工具。其格式为IF(逻辑测试, 结果真, 结果假)。举个例子,假设我们有一列销售数据,想要判断销售额是否超过5000元,超过则标记为"达标",否则标记为"未达标",可以这样使用:

=IF(A2 > 5000, "达标", "未达标")

2. COUNTIFS & SUMIFS家族:多条件计数与求和

这两个函数能够实现对满足多个条件的数据进行统计或求和。

  • COUNTIFS(判断区域1,判断条件1, [判断区域2,判断条件2], ...): 对满足所有给定条件的单元格数量进行计数。
    例如,统计销售额大于5000且产品类别为“A类”的记录数:
=COUNTIFS(B2:B100, ">5000", C2:C100, "A类")
  • SUMIFS(求和区域, 判断区域1,判断条件1, [判断区域2,判断条件2], ...): 根据多个条件对指定区域求和。
    例如,计算销售额大于5000且产品类别为“A类”的总销售额:
=SUMIFS(D2:D100, B2:B100, ">5000", C2:C100, "A类")

3. VLOOKUP(垂直查找匹配数据)

功能:VLOOKUP函数在表或数组的第一列中查找指定值,并返回同一行中其他列的值。

语法

VLOOKUP(lookup_value, table_array, col_index_num, [range_lookup])
  • lookup_value:用什么找,在员工名单表中想找的某个员工姓名,用员工ID找。
  • table_array:去哪里找,去整个员工名单表找,VLOOKUP会在这一区域的第一列中搜寻你的“lookup_value,所以员工ID就得在第一列
  • col_index_num:要找的对象在什么位置,VLOOKUP就会返回这个匹配项所在的行中指定列的值。这就像找到单词后,告诉你它在哪一页(即那一列)的定义。
  • [range_lookup]:这是一个可选参数,告诉Excel你希望查找的方式是精确还是近似。如果你说“FALSE”或“0”,那就表示必须完全一样才算是找到了;如果是“TRUE”或“1”,那只要比查找值小的最大值就可以。

示例
销售明细表
在这里插入图片描述
员工表
在这里插入图片描述

要统计每个员工的销售额,需要在销售明细表中根据员工ID,去员工表中匹配到员工的姓名
在这里插入图片描述

用什么找:员工ID,C列,第二行写C2
去哪里找:员工表,员工ID要在第一列,所以从B列开始选,一直选到包含要找的对象
要找的对象在第一列,从B开始数,在第2列
查找的方式:精确查找,选0

4. MATCH(查找数据所处相对位置)

功能:MATCH函数返回某个值在一个数组中的相对位置或者匹配项的位置。

语法

MATCH(lookup_value, lookup_array, [match_type])
  • lookup_value:要找的目标,比如在一组数字中找特定的数字,或者在一列名字中找特定的名字。
  • lookup_array:搜索范围,相当于你要翻阅的一本书的目录部分。
  • [match_type]:控制查找方式,你可以指定是要求精确匹配(0),小于等于查找值的最大值(1),或者大于等于查找值的最小值(-1)。就好比是在书中找页码,既可以精确到某一页,也可以找到最后包含该主题的那一章。

示例
如果要在员工表中查找“老六”的位置,可以使用以下公式:
在这里插入图片描述
"老六"在C列的第5行,所以结果是5

5. INDEX(在指定区域内,获取相对位置的数据值)

功能:INDEX函数返回指定数组或单元格区域中的元素值。

语法

INDEX(array, row_num, [column_num])
  • array:一排、一列或者一个大矩阵,你想从这里取出特定位置的数据。
  • row_num:数组中的行号,好比你想去矩阵的第几层楼拿东西。
  • [column_num]:数组中的列号,就像是你要打开哪一扇窗户才能拿到那个物品。

示例
在这里插入图片描述

在B3:C5区域里面,找第3行,第2列,结果为”老六“

6. OFFSET(以某个区域为初始,进行上下偏移)

功能:OFFSET函数返回以某个参照单元格为基础,按照指定的行数和列数偏移后的新引用区域。

语法

OFFSET(reference, rows, cols, [height], [width])
  • reference:起点,也就是你从哪里开始移动的位置,可以理解为地图上的一个标记点。
  • rows:向下或向上的步数,类似于从参照点往下走几步或者往上走几步。
  • cols:向右或向左的步数,就如同从参照点往右跨几步或者往左跨几步。
  • [height][width]:这两个参数定义了新的引用区域有多高多宽,像是确定一个新的视野范围大小。如果只是取单个单元格的值,则通常不需要这两个参数。

示例
若要从A1单元格开始,向下偏移2行,向右偏移1列,然后得到同样大小的一个区域的值:

=OFFSET(A1, 2, 1)

这将返回A3单元格的值。

7. 函数嵌套

联合使用MATCH和INDEX的例子:

如果我们想在非首列查找的情况下模拟VLOOKUP的功能,例如,在E列查找特定员工ID并在同一行获取A列的入职日期,可以这样组合使用MATCH和INDEX:

=INDEX(A:A, MATCH(3, B:B, 0))

这个公式首先通过MATCH函数找到E列中3的位置,然后INDEX函数根据这个位置返回B列对应姓名。

二、数据分析利器:数据透视表制作与应用

1、数据透视表的创建步骤:

  1. 选择数据源:首先,选定包含待分析数据的单元格范围。确保数据集有清晰的标题行,并且数据无重复或遗漏。

  2. 插入数据透视表:点击“插入”菜单,选择“数据透视表”,在弹出对话框中确认数据区域和放置新透视表的位置(新的工作表或现有工作表中的指定位置)。

  3. 布局字段

    • 行区域:将字段拖拽到此处,代表分类变量,如产品类别和地区。
    • 列区域:定义报表横轴的分类,例如时间周期或销售员姓名。
    • 值区域:用于统计分析的数值字段,通常会被自动汇总,默认为求和,也可以更改为计数、平均值、最大值等。
    • 筛选器:对数据进行高级过滤,比如只查看特定季度的数据。

2、实例演示

假设我们有一份包含地区、产品类型、销售额的销售数据,可以通过数据透视表快速汇总各地区的不同产品类型的总销售额。只需将“地区”拖至行区,“产品类型”拖至列区,“销售额”拖至值区,即可生成交互式的统计报表。

地区产品类别销售额
北京A类产品5000
上海B类产品6000
北京A类产品7000
广州C类产品8000
上海A类产品9000

通过数据透视表,可以快速得到各地区各类产品的销售额总和。
在这里插入图片描述

3、适用场景

可以结合《1.3认知篇——数据分析的常见方法和思路》里面提到的对比分析法、交叉分析法、结构分析法以及平均分析法等进行分析

三、数据分析工具集

在这里插入图片描述
先把加载项打开
在这里插入图片描述

1. 描述性统计分析

-在Excel的数据分析工具集中,选择“描述统计”,然后输入数据区域,可以选择是否需要输出偏度、峰度等参数,点击确定后会生成一个包含数据集各项描述性统计量的新工作表。
可以快速计算数据集的中心趋势(如平均数、中位数)、分散程度(如标准差、方差)以及其他基本统计量,如最大值、最小值、四分位数等。

  • 直方图:创建数据分布的直方图,以图形方式展示数据频率分布。
  • 抽样:从数据集中抽取样本,支持简单随机抽样、分层抽样等多种方法。

2. 相关性与回归分析

  • 相关系数: 选择“相关性”,指定两个变量的数据区域,可得到两变量之间的Pearson相关系数及其显著性检验结果。
  • 单变量和多变量回归分析:通过建立数学模型来研究一个或多个自变量如何影响因变量的变化,得到回归方程并可以评估模型拟合优度和显著性。

3. 假设检验

  • T-Test:单样本T-Test用于测试样本均值是否等于已知总体均值;配对样本T-Test用来比较两组相关样本的均值差异;独立样本T-Test则对比两组独立样本的均值。

4. 方差分析 (ANOVA)

  • 在数据分析工具集中,选择“单因素方差分析”或“双因素方差分析”。指定输入数据区域、分组列等信息,运行后可以得到F统计值、P值以及各个组间的均值比较结果。
  • 30
    点赞
  • 93
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Excel报表上报&统计系统能够将电子表格软件MS Excel和大型数据库管理系统MS SQL Server 2000/2005/2008集成为一个网络报表平台。在这个平台上,用户可以充分利用MS Excel软件,通过本系统,实现Excel报表的收集及统计,轻松 、快速构建能够适应变化的网络报表系统,是一个非常实用的报表收集及统计工具Excel报表上报&统计系统,也可以在互联网上使用。 1.1 系统特色 1.灵活的模板管理功,通过报表模板定义,用户可以定义上报报表样式、填报单元格、统计单元格,可适应报表灵活的变化。 2.可控制报表的查询、填写权限,由用户根据权限设计、管理模板,大大增强了系统的适应性和可用性 3.可以使用户通过互联网或局域网进行填报 、修改、查询数据和引用外部数据源。 5.具有组织机构字典,可以分部门层次管理报表。 6.支持报表导入、导出功能。 7.只要会用Excel,就很容易使用本系统,培训成本和维护成本大大降低。 8.支持报表表间统计功能。 9.采用MS SQL Server2000作为系统数据库,企业的Excel文件和业务数据具有安全保障。 10.软件采用B/S结构,适用于局域网和广域网。只在一服务器端安装,其它用户只要用IE就可使用本系统,安装维护方便。 11.支持模板导入和模板导出功能。 12.灵活的用户权限管理。 13.可定制按条件删除数据任务。 14.支持Excel2000、Excel 2003、Excel 2007。 [返回页首] 1.2 系统主要功能 1、报表分部门上报收集功能。 2、报表查询功能。 3、报表多表合并统计功能。 4、报表模板自定义功能。 5、用户权限管理功能。 6、部门管理功能。 7、报表从Excel导出、打印功能。 [返回页首] 1.3 系统应用对象 政府机关、邮电通信、计算机、网络、商业/贸易、银行/金融/证券/保险/投资、税务、咨询、社会服务、旅游/饭店、健康/医疗服务、房地产、交通运输、法律/司法、娱乐/体育、媒介/广告、科研/教育、农业/渔业/林业/畜牧业、矿业/制造业等行业的报表管理用户。 2.软件注册 未注册的软件是试用版,试用版功能未有限制,但只能上报不超过5张报表,并且使用次数不超过15次。 如果您需要购买正式版,请遵循以下的购买流程。 第一步、用户与南昌鸣谦科技公司联系,商定合同。 联系方式: 电话:18970088701 电子邮件:mqcell@163.com 第二步、用户汇款 收款单位:南昌市鸣谦科技有限公司 开户银行:中国银行南昌市省府大院支行 帐号 :726466844258091001 第三步、用户把注册程序的机器码,通过电子邮件发送到鸣谦科技 或电话通知鸣谦科技公司。 第四步、鸣谦科技公司收到机器码和汇款后,将注册码通过电子邮件发送给用户或短信、电话通知对方。 第五步、用户输入注册码,软件变成正式版。
Python提供了多种库用于对Excel进行统计分析,其中最常用的是pandas和openpyxl库。下面是一个简单的例子,演示如何使用这两个库进行Excel数据的读取、统计分析。 首先,需要安装pandas和openpyxl库。可以使用以下命令来安装: ``` pip install pandas openpyxl ``` 接下来,假设我们有一个名为“data.xlsx”的Excel文件,其中包含一张名为“Sheet1”的工作表,包含以下数据: | Name | Age | Gender | Score | |------|-----|--------|-------| | Tom | 20 | Male | 90 | | Jane | 22 | Female | 85 | | Jack | 19 | Male | 95 | | Lily | 21 | Female | 92 | | John | 20 | Male | 88 | 现在,我们想要对这些数据进行统计分析,例如计算平均分、最高分和最低分等。可以使用以下代码实现: ```python import pandas as pd # 读取Excel文件 df = pd.read_excel('data.xlsx', sheet_name='Sheet1') # 计算平均分、最高分和最低分 mean_score = df['Score'].mean() max_score = df['Score'].max() min_score = df['Score'].min() # 输出结果 print('平均分:', mean_score) print('最高分:', max_score) print('最低分:', min_score) ``` 运行以上代码,输出结果如下: ``` 平均分: 90.0 最高分: 95 最低分: 85 ``` 除了以上的基本统计分析,pandas还提供了许多其他的数据处理和分析功能,例如数据筛选、排序、分组、聚合等。如果想要深入了解,可以参考pandas的官方文档。 如果想要对Excel文件进行更复杂的操作,例如创建新的工作表、写入数据等,可以使用openpyxl库。以下是一个示例代码,演示如何使用openpyxl库创建一个新的工作表,并在其中写入数据: ```python from openpyxl import Workbook # 创建一个新的工作簿 wb = Workbook() # 获取默认工作表 ws = wb.active # 写入数据 ws['A1'] = 'Name' ws['B1'] = 'Age' ws['C1'] = 'Gender' ws['D1'] = 'Score' ws['A2'] = 'Tom' ws['B2'] = 20 ws['C2'] = 'Male' ws['D2'] = 90 ws['A3'] = 'Jane' ws['B3'] = 22 ws['C3'] = 'Female' ws['D3'] = 85 # 保存文件 wb.save('new_data.xlsx') ``` 运行以上代码后,将会在当前目录下生成一个名为“new_data.xlsx”的文件,其中包含一个名为“Sheet”的工作表,包含以上写入的数据。如果想要对Excel文件进行更复杂的操作,可以参考openpyxl的官方文档。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值