数据分析与Excel
1. 数据分析
随着互联网+的不断深入,网络中的数据量飞速膨胀。身处信息的海洋,在这个数据高速爆发的时代,企业想要快速发展,不能只简单地靠历史的经验,想要快速成功,就要认清数据、企业、社会三者之间的联系,因此就出现了数据分析这个职业。尤其是在以数据驱动为首的百度、美团、以及京东等企业中,数据分析都扮演了重要的角色。现在的传统企业也慢慢意识到了数据驱动的重要性,大部分企业也都在学着用数据分析解决问题,或者提升业绩,这类公司在进行数字化转型。比如:银行企业的中国银联,交通银行的东方航空,通信行业的移动、联通、电信等都在通过数据进行探索。
1.1 什么是数据分析
数据分析是通过技术手段,对业务进行流程梳理、指标监控、问题诊断以及效果评估,它的目的是对过去发生的现象进行评估和分析,并在这个基础上对未来事物的发生和发展做出预期分析处理,以此指导未来的一些关键性决策。
随着数据量的不断增长,数据处理以及信息挖掘技术也在迅速发展,人们对于数据的处理也不仅仅是数据存储以及信息的简单探索,而是结合一些模型的应用进一步分析。虽然现在出现了大量数据分析技术,例如:Python、R等编程语言以及MySQL、Hadoop等数据存储技术,但是Excel凭借其操作简单、灵活以及宽广的覆盖面,在数据分析中占据着一席之地。
1.2 数据分析流程
数据分析流程可以概括为:数据理解、提取数据、数据清洗、数据分析、数据可视化、撰写报告。
2. Excel用法
2.1 创建和保护
- 我们常说的表格文件其实就是工作簿。
工作表就是我们下方切换的N个活动页,创建一个工作簿的时候会自动的创建一个工作表。
单元格就是我们现在能够看到的每一个方格。 - 保护功能
1.保护工作簿: 防止其他用户对工作簿的结构进行更改,如移动、删除或者添加工作表。
2.保护工作表: 通过限制其他用户的编辑能力来防止他们进行不需要的更改。
3.保护单元格: 防止数据被篡改 - 操作方法
1.保护单元格:选中单元格单元格 --> 开始 --> 格式 --> 锁定单元格、保护工作表
2.保护工作表:在指定工作表右键 --> 保护工作表
3.保护工作簿:审阅 --> 保护工作簿
2.2快速输入
填充句柄出现方式:鼠标放在选中单元格的右下角,让鼠标变成黑色十字架,按住鼠标右键往下拖
-
复制单元格:同时将单元格的样式和内容复制给其他单元格 填充序列:复制单元格样式,将单元格内容按照一定规则变化 仅填充格式:只复制单元格样式 不带格式填充:只将单元格内容按照一定规则变化 往下填充的时候按住ctrl往下拖能达到复制单元格的功能 以年填充:按照年份变化。(以月填充、以天数填充同理) 以月填充:按照月份变化填充。 填充工作日:与以天数填充同理,仅仅去除每周周末 -
自动找规律填充:
方法:从数据列后方相邻单元格输入内容,选中单元格,鼠标放置到单元格右下角后右键按住向下拖。
邮编100089中国 100089 中国56个民族 56 一年12个月 12 邮编100092中国 100092 邮编100093中国 100093 邮编100094中国 100094
2.3 :填充数据
文件 --> 选项 --> 高级 --> 编辑自定义列表(鼠标放在右下角按住左键向下拖)
星期一 | 一月 | 小张 |
---|---|---|
星期二 | 二月 | 小李 |
星期三 | 三月 | 小王 |
星期四 | 四月 | 小张 |
星期五 | 五月 | 小李 |
星期六 | 六月 | 小王 |
星期日 | 七月 | 小张 |
星期一 | 八月 | 小李 |
星期二 | 九月 | 小王 |
星期三 | 十月 | 小张 |
2.4 :多个不连续单元填充相同数据
方法:Ctrl+鼠标左键选中单元格,点击最后一个单元格的时候直接输入数据填入数据,Ctrl+Enter补全
花花 | |||
---|---|---|---|
花花 | |||
张飞 | 花花 | 花花 | |
张三 | 花花 | ||
花花 | |||
张三 | |||
张三 | 花花 | ||
花花 | |||
张三 | |||
2.5:多个不连续单元格不同数据
方法:选中下方数据,Ctrl + G,选中定位条件—>选中空值—>在最上方函数位置输入=,对空值进行单元格引用,Ctrl + Enter
山东省 |
---|
山东省 |
山东省 |
山东省 |
四川省 |
四川省 |
四川省 |
四川省 |
四川省 |
四川省 |
四川省 |
上海市 |
新疆维吾尔族自治区 |
新疆维吾尔族自治区 |
新疆维吾尔族自治区 |
新疆维吾尔族自治区 |
新疆维吾尔族自治区 |
内蒙古 |
内蒙古 |
内蒙古 |
内蒙古 |
内蒙古 |
内蒙古 |
内蒙古 |
内蒙古 |
2.6:文本记忆输入,注:必须连续单元格输入才会生效
1.Alt + 向下箭头,提示之前输入的内容 | ||
---|---|---|
2.直接输入内容,根据提示选择回车。 |
3、数据验证
数据有效性不仅能够对单元格的输入数据进行条件限制,还可以在单元格中创建下拉列表菜单方便用户选择输入。
数据有效性:选中单元格 --> 数据 --> 数据验证 --> 数据验证 --> 设置 --> 允许:序列 --> 来源(点击数据来源的时候按住shift)
某公司有三个部门:财务部,市场部,产品部(数据来源)
部门(对数据进行验证) |
---|
圈出无效数据(大于10)
方法:选中数据——数据——数据验证——(值介于1-10之间)—— 数据验证——圈出无效数据
### 英语演讲比赛评分表
30% | 30% | 40% | 总分 | |
激情、仪表 | 发音语调 | 结构内容 | ||
1到10 | ||||
李俊杰 | 13 | 15 | 10 | 12.40 |
王宗儒 | 7 | 6 | 4 | 5.50 |
徐士杰 | 9 | 13 | 9 | 10.20 |
邱晨峰 | 6 | 4 | 6 | 5.40 |
连理扬 | 8 | 7 | 6 | 6.90 |
张伟辰 | 4 | 5 | 6 | 5.10 |
陈信成 | 7 | 7 | 9 | 7.80 |
敦政霆 | 11 | 9 | 10 | 10.00 |
尤惟翔 | 7 | 6 | 6 | 6.30 |
王嵩钧 | 8 | 14 | 15 | 12.60 |
王俐婷 | 9 | 8 | 6 | 7.50 |
黄巧如 | 7 | 6 | 8 | 7.10 |
吕佩珊 | 10 | 7 | 9 | 8.70 |
吕凤虹 | 7 | 7 | 8 | 7.40 |
胡惠珍 | 5 | 4 | 5 | 4.70 |
高莞婷 | 3 | 3 | 4 | 3.40 |
张嘉玮 | 9 | 8 | 6 | 7.50 |
张碧秀 | 11 | 10 | 12 | 11.10 |
谢琬茹 | 9 | 5 | 7 | 7.00 |
4、单元格查找与替换
要求: 将成绩为“0”的替换为“补考”。
出现问题:存在数字0的单元格都会被替换为补考。
解决方法:查找与选择 --> 替换 --> 单元格匹配
CTRL+G/F:快捷键
姓名 | 英语 | 办公软件操作 | 电子商务 | 计算机基础 |
---|---|---|---|---|
李楠 | 70 | 96 | 73 | 79 |
方鹏 | 63 | 94 | 91 | 78 |
李磊 | 89 | 65 | 0 | 0 |
王小若 | 81 | 77 | 73 | 80 |
陈雨 | 0 | 87 | 84 | 88 |
石璐 | 91 | 95 | 84 | 80 |
张瑛 | 73 | 92 | 92 | 89 |
程晓 | 80 | 86 | 0 | 0 |
王丽 | 72 | 55 | 88 | 70 |
赵军力 | 69 | 69 | 63 | 76 |
王明 | 96 | 80 | 85 | 64 |
李丽 | 64 | 0 | 74 | 86 |
张帆 | 72 | 64 | 97 | 74 |
张珊珊 | 60 | 95 | 69 | 61 |
刘丽丽 | 78 | 93 | 81 | 0 |
石节庆 | 62 | 63 | 64 | 70 |
路瑶 | 0 | 0 | 0 | 63 |
李贵明 | 84 | 90 | 87 | 99 |
5、快速选择数据
作:Ctrl + Shift + 方向键
优点:可以快速选择规模较大的区域数据
缺点:如果起始行或者起始列出现空值,会出现选择不全的问题,需要稍加注意。
6 选择性粘贴
要求:使用选择性粘贴方法在增加比例列实现“金额”数据列数据增加25%。
操作步骤:复制增长比例——选中需要增长的数据——右键鼠标——选择性粘贴——数值——乘
1.输入需要增加的比例。
2.将需要变化的数据提前复制一份。
3.复制比例,选中数据,选择正确的选项即可。
未增长前:
¥81,194.55 |
---|
¥8,573.73 |
¥22,508.30 |
¥5,509.58 |
¥56,915.03 |
增长后
¥ 101,493.19 |
---|
¥ 10,717.17 |
¥ 28,135.38 |
¥ 6,886.98 |
¥ 71,143.79 |
¥ 6,886.98 |
¥ 88,173.81 |
7、冻结窗格
更多操作操作:视图 --> 冻结窗格
更多操作操作:视图 --> 冻结窗格注意:如果要冻结前N行,要选到第N+1行再冻结。冻结列同理
8、导入外部数据
导入外部数据:
Excel支持从外部导入数据,导入途径包含:本地各类存储数据的文件、数据库、网站等。
操作方式:数据 --> 获取数据 --> 选择对应功能选项
例一:从CSV文件导入数据
方法:数据——数据获取。wps:数据——导入数据——注意选择编码方式——分隔符选择逗号。
9、数据类型
Excel中存在5中数据类型,分别是:
文本、数值、日期和时间、逻辑值、错误值
文本:姓名、性别、住址以及一些不需要计算的数值,比如:手机号、银行卡号等。
数值:整数、小数、科学计数等需要计算的数字。
逻辑值:TRUE、FALSE。
错误值:错误值通常是在使用公式时,由于种种原因没能返回需要的结果,而是返回了一串不同字符组成的错误值代码。
常见错误值:
#VALUE! : 键入公式的方式错误。或者引用的单元格错误。
#DIV/0! : 这个错误值是说数字被0除了,因为0不能当被除数嘛。
#NAME? : 在公式中是因为公式名称中出现拼写错误
#N/A! : 公式找不到引用的值
#REF! : 公式引用无效单元格时将显示 #REF! 错误。 当公式所引用的单元格被删除或被粘贴覆盖时最常发生这种情况。
#NUM! : 公式或函数中包含无效数值时
如果单元格所含的数字、日期或时间比单元格宽,或者单元格的日期时间公式产生了一个负值,就会产生
#NULL! : 如果在公式中使用了不正确的区域运算符,或者在区域引用之间使用了交叉运算符(空格字符)来指定不相交的两个区域的交集,将显示此错误。
如何查看Excel单元格数据类型:TYPE()
数字=1 | |
文本=2 | |
逻辑值=4 | |
误差值=16 | |
数组=64 | |
复合数据=128 |
10 、单元格格式
2020年5月3日 —— 长期日
2020/5/3 —— 短期日 (方法:开始——数字)
姓名 | 注册时间 | 单价 | 是否全款 | 数量 | 总价 |
---|---|---|---|---|---|
程咬金 | 2020年5月3日 | 221 | TRUE | 1 | 221 |
李白 | 2019年3月2日 | 269 | TRUE | 1 | 269 |
孙尚香 | 2018年3月6日 | 368 | FALSE | 5 | 1840 |
赵云 | 2019年10月1日 | 490 | TRUE | 1 | 490 |
韩信 | 2014年9月3日 | 280 | TRUE | 5 | 1400 |
武则天 | 2018年7月19日 | 275 | FALSE | 1 | 275 |
曹操 | 2019年9月23日 | 313 | FALSE | 4 | 1252 |
鲁班 | 2014年1月20日 | 254 | TRUE | 2 | 508 |
1.将注册时间改成“2020/5/3”形式 | 短日期 | ||||
---|---|---|---|---|---|
2.将单价改成“221元”格式 | —— | #元 | |||
3.总价改成“221.00元”格式 | —— | #.##.00 | |||
4.将数量大于4的改成绿色,数量小于4的改成红色 | —— | [绿色][>4];[红色][<4];[绿色] |
自定义格式语法 | |||
---|---|---|---|
# | 数字占位符:四舍五入;不会保留无意义的0 | ||
‘0 | 数字占位符:四舍五入;会保留无意义的0 | ||
? | 数字占位符:四舍五入;用空格代替无意义的0 | ||
@ | 文本占位符:在格式中代表文本数据本身。固定部分用“”。 | ||
* | 重复*后面的符号,直到填满单元格 |