数据分析与Excel
1. 数据分析
随着互联网+的不断深入,网络中的数据量飞速膨胀。身处信息的海洋,在这个数据高速爆发的时代,企业想要快速发展,不能只简单地靠历史的经验,想要快速成功,就要认清数据、企业、社会三者之间的联系,因此就出现了数据分析这个职业。尤其是在以数据驱动为首的百度、美团、以及京东等企业中,数据分析都扮演了重要的角色。现在的传统企业也慢慢意识到了数据驱动的重要性,大部分企业也都在学着用数据分析解决问题,或者提升业绩,这类公司在进行数字化转型。比如:银行企业的中国银联,交通银行的东方航空,通信行业的移动、联通、电信等都在通过数据进行探索。
1.1 什么是数据分析
数据分析是通过技术手段,对业务进行流程梳理、指标监控、问题诊断以及效果评估,它的目的是对过去发生的现象进行评估和分析,并在这个基础上对未来事物的发生和发展做出预期分析处理,以此指导未来的一些关键性决策。
随着数据量的不断增长,数据处理以及信息挖掘技术也在迅速发展,人们对于数据的处理也不仅仅是数据存储以及信息的简单探索,而是结合一些模型的应用进一步分析。虽然现在出现了大量数据分析技术,例如:Python、R等编程语言以及MySQL、Hadoop等数据存储技术,但是Excel凭借其操作简单、灵活以及宽广的覆盖面,在数据分析中占据着一席之地。
1.2 数据分析流程
数据分析流程可以概括为:数据理解、提取数据、数据清洗、数据分析、数据可视化、撰写报告。
2. Excel用法
2.1 保护的操作方法
1.创建工作簿、工作表
工作簿、工作表、单元格的关系:
我们常说的表格文件其实就是工作簿。
工作表就是我们下方切换的N个活动页,创建一个工作簿的时候会自动的创建一个工作表。
单元格就是我们现在能够看到的每一个方格。
2.保护功能
(1)保护工作簿: 防止其他用户对工作簿的结构进行更改,如移动、删除或者添加工作表。
(2)保护工作表: 通过限制其他用户的编辑能力来防止他们进行不需要的更改。
(3)保护单元格: 防止数据被篡改。
3.操作方法
a.保护单元格:选中单元表中需要保护的单元格 --> 开始 --> 格式 --> 锁定单元格、然后保护工作表
b.保护工作表:在指定工作表右键 --> 保护工作表
c.保护工作簿:审阅 --> 保护工作簿
2.2 快速输入(填充)
2.2.1 填充柄得使用
1.操作方法:
(1)填充柄出现的方式:鼠标放在选中单元格得右下角,让鼠标变成黑色十字架,按住鼠标不放往下拖
(2)操作方法:选中单元格,鼠标放置到单元格右下角后右键向下拖拽,选择对应选项。
2.可以操作得结果:
a.复制单元格:同时将单元格的样式和内容复制给其他单元格
b.填充序列:复制单元格样式,将单元格内容按照一定规则变化
c.仅填充格式:只复制单元格样式
d.不带格式填充:只将单元格内容按照一定规则变化
e.以年填充:按照年份变化。(以月填充、以天数填充同理)
f.填充工作日:与以天数填充同理,仅仅去除每周周末
2.2.2 快速填充
操作方法:
从数据列后方相邻单元格输入内容,选中单元格,鼠标放置到单元格右下角后右键向下拖拽,选择对应选项。
自动找到其规律(按自己,不是操作得到的想法,但是很好用)(自动生成)
wps :选中单元格 --> 开始 --> 填充 --> 智能填充
2.2.3 自定义列表填充
自定义列表位置:文件 --> 选项 --> 高级 --> 编辑自定义列表
然后继续直接拖鼠标左键
2.2.4 多个不连续单元格同数据
操作方法:
Ctrl+鼠标左键 --> 选中单元格 --> 填入数据 --> Ctrl+Enter补全
Shift+F8,鼠标点击单元格,输入数据,Ctrl+Enter补全)
2.2.5 多个不连续单元格不同数据
操作方法:
选中下方数据,Ctrl + G,选中空值,对空值进行单元格引用,Ctrl + Enter
单元格引用:=点击需要引用得单元格
2.2.6 文本记忆输入
(1)Alt + 向下箭头
(2)直接输入内容,根据提示选择回车。
2.3 数据验证
2.3.1 数据有效性
操作方法:
选中单元格 --> 数据 --> 数据验证 --> 数据验证 --> 设置 --> 允许:序列 --> 来源
(wps:选中单元格 --> 数据 --> 有效性)
2.3.2 圈释无效数据
先设置数据验证范围 --> 选择数据单元格位置 --> 数据验证下得圈释无效数据
(方法:1.选择B32:D50设置数据验证1-10的范围;2.圈释无效数据。)
2.4 定位条件
Ctrl + G --> 填入需要的值 --> 按组合键Ctrl+Enter填充
(操作:开始 --> 查找和选择 --> 定位条件(Ctrl + G或者F5)
使用定位条件选择区域中空单元格,填入100,按组合键Ctrl+Enter填充)
2.5 单元格查找替换
开始 --> 查找与选择 --> 替换 --> 单元格匹配
查找Ctrl + F
替换Ctrl + H(需要点击单元格匹配)
2.6 快速选择数据
操作:Ctrl + Shift +方向键
优点:可以快速选择规模较大的区域数据
缺点:如果起始行或者起始列出现空值,会出现选择不全的问题,需要稍加注意。
2.7 选择性粘贴
操作方法:
先将原数据复制一份到需要放在的地方,然后单独输入一个需要变得数据进行复制,然后在选中放在需要变动得所有数据,选择性粘贴。
(1)输入需要增加的比例。
(2)将需要变化的数据提前复制一份。
(3)复制比例,选中数据,选择正确的选项即可。
2.8 冻结单元格
操作:视图 --> 冻结窗格
注意:如果要冻结前N行,要选到第N+1行再冻结。冻结列同理。
2.9 导入外部数据
操作方式:数据 -->获取数据 --> 选择对应功能选项
Excel支持从外部导入数据,导入途径包含:本地各类存储数据的文件、数据库、网站等。
2.10 excel数据类型
Excel中存在5中数据类型,分别是:
文本、数值、日期和时间、逻辑值、错误值
文本:姓名、性别、住址以及一些不需要计算的数值,比如:手机号、银行卡号等。
数值:整数、小数、科学计数等需要计算的数字。
逻辑值:TRUE、FALSE。
错误值:错误值通常是在使用公式时,由于种种原因没能返回需要的结果,而是返回了一串不同字符组成的错误值代码。
常见错误值:
#VALUE! 键入公式的方式错误。或者引用的单元格错误。
#DIV/0! 这个错误值是说数字被0除了,因为0不能当被除数嘛。
#NAME? 在公式中是因为公式名称中出现拼写错误
#N/A! 公式找不到引用的值
#REF! 公式引用无效单元格时将显示 #REF!错误。 当公式所引用的单元格被删除或被粘贴覆盖时最常发生这种情况。
#NUM! 公式或函数中包含无效数值时
如果单元格所含的数字、日期或时间比单元格宽,或者单元格的日期时间公式产生了一个负值,就会产生
#NULL! 如果在公式中使用了不正确的区域运算符,或者在区域引用之间使用了交叉运算符(空格字符)来指定不相交的两个区域的交集,将显示此错误。
如何查看Excel单元格数据类型:TYPE()
数字=1
文本=2
逻辑值=4
误差值=16
数组=64
复合数据=128
数据 | 类型 |
---|---|
1 | 1 |
abc | 2 |
‘100 | 2 |
TRUE | 4 |
2022/1/2 | 1 |
#NAME? | 16 |
2.11 单元格格式
(1)打开设置单元格格式
开始 --> 数字格式
鼠标右击点开设置单元格格式
(2)
自定义格式语法:
a. # - 数字占位符,四舍五入,不保留无意义的0
b. 0 - 数字占位符,四舍五入,会保留无意义的0
c. ? - 数字占位符,四舍五入,不会保留无意义的0,会用空格来代替数据中无意义的0
d. , - 千位分隔符,使用数字占位符的时候设置逗号分隔的位数
e. @ - 文本占位符,在格式用代表文本数据本身
f. * - 重复*号后面的符号,直到把单元格填满为止
g. “” - 需要固定写的,不会改变数据本身,只是为了显示
h. [] - [颜色1][条件1]格式1;[颜色2][条件2]格式2;[颜色3][条件3]格式3;[颜色4][条件4]格式4
区段1;区段2;区段3;区段4
区段1:[条件1]要返回的值 ,数据满足条件1
区段2:[条件2]要返回的值 ,数据满足条件2
区间3:不满足条件1、2要返回的值 ,条件1条件2都不满足
区间4:文本格式,文本数据的时候
条件格式化只限于使用三个条件,其中两个 条件是明确的,另个是“所有的其他”。
i. 颜色:
可有八种颜色可选:红色、黑色、黄色、绿色、白色、蓝色、青色和洋红
[红色][<=100]“-”#;[黑色][>100] 不会显示负号
(注:颜色代码的另一种方式,[颜色N]:是调用调色板中颜色, N 是 [1,56] 之间的整数。 代码:[颜色1];[颜色2]; [颜色3];[颜色4] 效果:显示结果为正数为调色板上第1种颜色……)
2.12 条件格式
数据条:选中单元格 --> 开始 --> 条件格式 --> 数据条
色阶:选中单元格 --> 开始 --> 条件格式 --> 色阶
添加图集:选中单元格 --> 开始 --> 条件格式 --> 图集