什么是数据分析
官方说法: 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研 究和概括总结的过程。
为什么学习数据分析
-
数据分析现在是顶级组织的优先事项
随着业务竞争的加剧,经济形势的僵化以及业务驱动型决策的制定,顶级企业现在必须转向 数据分析来识别新的市 场机会,用于改善业务的口袋,改进的服务和产品以及与竞争对手相 比的业务。 如今,77%的顶级组织将数据分析视为其业务绩效的非常关键的组成部分。业务 绩效通过分析来衡量。这意味着数 据专业人员通常会对公司政策,决策和营销策略产生巨大 影响
-
您将成为公司决策的核心
最高期望的工作期望之一就是做出决定的权力。通常,缺乏决策权会使工作变得不尽如人意, 就像伟大的企业轮盘 中的另一个齿轮一样。 但是,作为数据分析专家,您是公司决策的核心 。实际上,您将成为业务决策和未来战略不可或缺的一部分,因为 您研究趋势,就未来的改 进范围提供了有意义的见解,从而在组织中发挥了重要作用和宗旨。
-
数据分析专业人员可以选择广泛的职位和领域。
- 指标和分析专家
- 数据分析师
- 运营分析师
- 销售分析师
- 金融分析师
- 市场分析师数据
- 分析顾问
- 数据挖掘工程师
数据分析的几种方式详解
Excel: 人人都可以成为数据分析师,入门门槛低,敏捷快速响应需求,最大只能处理100W数据,可
以做数据可视化。
SQL: 处理数据量庞大,更适用于进行实时监控的操作,不能直接数据可视化sql有性能瓶颈,数据量
大,访问量大
Python:python比起Excel和SQL缺点在于学习成本更高一点,优点是几乎可以完成数据分析所有的
工作,而且当你熟练 掌握之后Python的缺点便不存在了,而优点却可以带来巨大的效率提升。Excel
和SQL固然很棒,可以完成大部分的传统 数据分析工作,用SQL取数,然后Excel可视化分析。但是
随着数据分析时代的来临,数据分析难道只是简简单单的取数 +可视化嘛?使用Python你可以方便
地进行各种数据挖掘算法的建模,这个恐怕SQL和Excel很难做
Excel使用(推荐使用office 2016(增强版))
- 工作簿(一个Excel文件)
- 工作表(工作簿中的单元Sheet)
保护功能
对工作簿加密 -- 左侧左上角点击'文件',保护工作簿,用密码加密,保存退出。
对工作簿解密 -- 如上,取消掉密码,保存退出即可。
对工作表加密(仅仅只是保护表结构) -- 点击'审阅','保护工作簿','输入密码','确认密码'。
对工作表解密 -- 如上操作,输入密码即可。
保护全部单元格不允许修改-保护的是全部的数据 --审阅->保护工作表-->输入密码->确认密码
保护部分单元格不允许修改 -- 开始->字体/对齐方式/数字->保护->锁定->审阅->保护工作表
快速输入数据
自定义列表(选中后方框右下角有个+号拖动即可)
-- 文件->选项->高级->编辑自定义列表->新序列->添加->确定
注意:列表中的的逗号,必须为英文格式
填充柄(自动填充内容)
自动增长
文本+数字 -- 选中->右下角+号->拖动即可自动增长
数字+文本 -- 同上
不会自动增长
数字 -- 选中后,需要按住Ctrl,出现+号即可拖动
等差序列(类似2,4,6...)
1.点击单元格鼠标右键,下拖,选择序列,等差序列,步长值为2,终止值x
2.选中--->开始--->编辑--->填充--->序列
等比序列(类似1,2,4,8,16...)
1.点击单元格鼠标右键,下拖,选择序列,等比序列(这步不同),步长值为2,终止值x
2.选中--->开始--->编辑--->填充--->序列
注意:excel的初始时间是1900/1/1,代表的整数类型是1.如果涉及到时分秒,那么就使用小
数表示 eg:1.5代表的 是1900/1/1 12:00
工作日填充(不填周末)
1.点击单元格鼠标右键,下拖,选择序列,日期,工作日,步长值为1,终止值x
2.或者:开始--->编辑--->填充--->序列
月份填充
1.点击单元格鼠标右键,下拖,选择序列,日期,月,步长值为1,终止值x
2.开始--->编辑--->填充--->序列
年份填充
同上...
多个不连续单元格输入同一个数据
-- 选中单元格->输入想要输入的数据->按Ctrl+回车
文本记忆式输入(表中有的内容才可以选择表中内容填充)
-- 鼠标右键--->从下拉列表中选择
数据验证(单元格中只能输入指定内容)
--数据---》数据验证---》数据验证---》允许---》序列---》来源---》选中
数字自定义格式
-- 开始---》字体/对齐方式/数字---》数字---》自定义---》类型---》输入---》[=1]"男";[=0]"女"
注意:只能有两个值
同时填充多个工作表
-- 连续的单元格使用shift
-- 不连续的单元格使用ctrl
巧妙利用自动更正选项,快速录入数据(输入设定的内容,自动更正单元格的数据)
-- 文件---》选项---》校对---》自动更正选项---》自动更正---》添加
导入txt数据
数据---》自其他来源---》自文本---》预览---》分隔符---》逗号---》确定
导入Access数据库
数据---》自其他来源---》自文本---》自Access数据库---》分隔符---》逗号---》确定
Excel数据类型
类型 | 示例 |
---|---|
文本 | 姓名、职务、描述、住址… |
数值 | 年龄,0,1,2,3,4,5,6… |
逻辑值 | True,False |
错误数据类型如下:
错误值 | 错误类型 |
---|---|
[#####] | 超过单元格宽度,一般在手机号、身份证、日期等长数字时会出现。 |
[#VALUE!] | 参数类型错误 参数的数据格式错误,函数中使用的变量或参数类型错误。 |
[#DIV/0!] | 除数为0,或除数引用的单元格为空值。 |
[#NAME!] | 不能识别的文本或其他参数。 |
[#N/A] | 公式中没有可用数值,目标或参数缺失 |
[#REF!] | 引用地址失效 一般是删除了表格中个别单元格,造成公式引用地址效。 |
[#NULL] | 公式中的交集输入不正确 |
[#NUM!] | 无效数字值(无法接受的参数) |
自定义数据格式
1. 开始---》字体/对齐方式/数字---》数字---》自定义---》0"元/年" -- 整数类型
2. 开始---》字体/对齐方式/数字---》数字---》自定义---》@"季度" -- 字符串/文本
给不同的数据上颜色(取异常值)
[绿色]0.0%;[红色](0.0%);[黑色]0.0 -- 百分比给绿色,括号中数据给红色,0给黑色
注意:数字格式最多可包含四个代码部分,各个部分用分号分隔。这些代码部分按先后顺序定义
正数、负数、零值和文本的格式
文本型数字转换数值型数字(进行运算分析数据)
文本类型转数值类型的方法有六种
公式:=VALUE(单元格)
运算:=A1*1 =A1/1 =A1+0 =A1-0 =--A1
注意:转换完成后,才可以用公式进行运算(做数据分析)
标准化规范化
正规日期格式:1900/1/1
注意:正规日期可以进行加减法运算,不正规日期是不可以进行加减法运算的。
不规范日期1(2014.1.1)
开始---》查找和选择---》替换---》./---》全部替换
如果出现了类似二○一四年一月二日样的结构可以修改为短日期 开始---》日期---》短日期
或
=SUBSTITUTE(A3,".","/")*1 要替换的数据,替换的内容,替换的结果
不规范日期 (980102)
=--TEXT(F3,"##-##-##")
注意:(1)TEXT(F3,"##-##-##")是文本类型 (2)--是修改为日期类型 (3)开始---》日期---》短日期
或
=--TEXT(A7,"#-00-00") 替换的单元格,替换的格式
分列:固定宽度/日期格式(20140101)
选中--》数据---》分列---》日期---》完成
规范时间(122040)
=--TEXT(A10,"00!:00!:00") -- 规范的单元格,规范后的格式 例如:12:20:40
批量删除单引号
格式刷复制一个空单元格。
复制到这个区域即可。
快速计算
ALT + =
快速选中
Ctrl + Shift + ↓
选中不连续单元格
Ctrl + 鼠标
或
Shift + F8
选数据+复制公式
填充柄功能:双击,复制一列同类型公式,一次几百个、几万个等
拆分冻结
1. 视图---》冻结窗格---》冻结首行
2. 视图---》冻结窗格---》冻结首列
3. 视图---》冻结窗格---》冻结窗格(单元格)一般首行首列
选择空单元格(多个)
先选中全部,ctrl + shift ↓ →
1. 案例:将所有空格填充100
2. 开始---》查找/选择---》定位条件---》空值---》输入数据---》ctrl+enter
复制分类汇总结果
1. 案例:复制可见单元格,不显示隐藏数据
2. 开始---》查找/选择---》定位条件---》可见单元格
选中错误单元格
1. 案例:将错误的单元格修改为0
2. 开始---》查找/选择---》定位条件---》公式---》错误---》输入数据---》ctrl+enter
把行改为列
选中数据---》ctrl+c---》粘贴---》选择性粘贴---》转置---》确定
联动数据
选中数据---》ctrl+c---》粘贴---》选择性粘贴---》链接图片---》确定
#注意:修改源数据,复制过去的书跟着变动
选择性粘贴-将两列数据合为一列
1. 案例:将金额插入到对应部门名称下面
2. 创建辅助列---》添加对应数量的整数---》添加对应数量的小数---》数据---》升序---》扩展选定区域---》 复制右栏数据到左栏数据(从第二个空单元格粘贴)---》粘贴---》选择性粘贴---》跳过空单元
3. 注意:整数数量和小数数量都要保证数据完整性
单元格匹配替换
1. 案例:将0替换为补考
2. 开始---》查找和选择---》替换---》单元格匹配---》全部替换
辅助列-隔行插入1空行
1. 案例:给每一列车次上都要添加一个标题
2. 添加辅助列整数数据---》添加辅助列小数数据---》数据---》升序---》复制添加内容---》开始 查找或选择---》定位条件---》空值---》确定---》粘贴
数据验证-多行变一行(整张表的数据范围添加进去)
前提:序列只能添加一列。
案例:数据---》数据验证---》序列---》来源---》一列---》完成
1. 案例:多行多列放在一个下拉选框
2. 公式---》名称管理器---》新建---》名字---》单列(特殊注意)---》数据---》数据验证---》序列---》=QF ---》公式---》名称管理器---》编辑---》全选中---》完成
注意:顺序不能错,开始设置名称多行多列,不成功
圈释无效数据
案例:圈出非1到10之间的数据
数据---》数据验证---》整数---》1到10---》圈出无效数据
注意:第一次圈出的范围
快速填充
1. 方案1:下拉到底部,快速填充
2. 方案2:ctrl+e
注意:也可以直接在汉字中提取数字进行填充
分列-源数据(去重)
1. 案例:查询有多少国家参加世界杯
2. 实现:1. 将VS替换成, 开始---》查找和选择---》替换
3. 按,分列 数据---》分列---》逗号
4. 将第二列剪切到第一列后面
5. 数据---》删除重复值
数据整理
案例:将爬取的歌单输入到excel中
实现:
数据---》分列---》.---》完成
复制数据---》粘贴---》转置
快速填充/ctrl+e
如果有特殊字符可以使用替换 eg:(藏语---》(藏语)
全年合并
案例:将上半年和下半年的数据合并计算
实现:
数据---》合并计算---》添加---》首行---》左列---》确定