数据分析--介绍与Excel入门

什么是数据分析

官方说法: 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研 究和概括总结的过程。

为什么学习数据分析

  1. 数据分析现在是顶级组织的优先事项

    随着业务竞争的加剧,经济形势的僵化以及业务驱动型决策的制定,顶级企业现在必须转向
    数据分析来识别新的市 场机会,用于改善业务的口袋,改进的服务和产品以及与竞争对手相
    比的业务。 如今,77%的顶级组织将数据分析视为其业务绩效的非常关键的组成部分。业务
    绩效通过分析来衡量。这意味着数 据专业人员通常会对公司政策,决策和营销策略产生巨大
    影响
    
  2. 您将成为公司决策的核心

     最高期望的工作期望之一就是做出决定的权力。通常,缺乏决策权会使工作变得不尽如人意,
     就像伟大的企业轮盘 中的另一个齿轮一样。 但是,作为数据分析专家,您是公司决策的核心
     。实际上,您将成为业务决策和未来战略不可或缺的一部分,因为 您研究趋势,就未来的改
     进范围提供了有意义的见解,从而在组织中发挥了重要作用和宗旨。
    
  3. 数据分析专业人员可以选择广泛的职位和领域。

  • 指标和分析专家
  • 数据分析师
  • 运营分析师
  • 销售分析师
  • 金融分析师
  • 市场分析师数据
  • 分析顾问
  • 数据挖掘工程师

数据分析的几种方式详解

Excel: 人人都可以成为数据分析师,入门门槛低,敏捷快速响应需求,最大只能处理100W数据,可
以做数据可视化。 

SQL: 处理数据量庞大,更适用于进行实时监控的操作,不能直接数据可视化sql有性能瓶颈,数据量
大,访问量大 

Python:python比起Excel和SQL缺点在于学习成本更高一点,优点是几乎可以完成数据分析所有的
工作,而且当你熟练 掌握之后Python的缺点便不存在了,而优点却可以带来巨大的效率提升。Excel
和SQL固然很棒,可以完成大部分的传统 数据分析工作,用SQL取数,然后Excel可视化分析。但是
随着数据分析时代的来临,数据分析难道只是简简单单的取数 +可视化嘛?使用Python你可以方便
地进行各种数据挖掘算法的建模,这个恐怕SQL和Excel很难做

Excel使用(推荐使用office 2016(增强版))

  • 工作簿(一个Excel文件)
  • 工作表(工作簿中的单元Sheet)

保护功能

对工作簿加密      				-- 左侧左上角点击'文件',保护工作簿,用密码加密,保存退出。
对工作簿解密						-- 如上,取消掉密码,保存退出即可。

对工作表加密(仅仅只是保护表结构)     -- 点击'审阅','保护工作簿','输入密码','确认密码'。
对工作表解密					    -- 如上操作,输入密码即可。


保护全部单元格不允许修改-保护的是全部的数据	 --审阅->保护工作表-->输入密码->确认密码
保护部分单元格不允许修改		-- 开始->字体/对齐方式/数字->保护->锁定->审阅->保护工作表

快速输入数据

自定义列表(选中后方框右下角有个+号拖动即可) 
				-- 文件->选项->高级->编辑自定义列表->新序列->添加->确定
注意:列表中的的逗号,必须为英文格式


填充柄(自动填充内容)
	自动增长
		文本+数字			-- 选中->右下角+号->拖动即可自动增长
		数字+文本			-- 同上
	
	不会自动增长
		数字					-- 选中后,需要按住Ctrl,出现+号即可拖动

	等差序列(类似2,4,6...)
		1.点击单元格鼠标右键,下拖,选择序列,等差序列,步长值为2,终止值x
		2.选中--->开始--->编辑--->填充--->序列
	
	等比序列(类似1,2,4,8,16...)
		1.点击单元格鼠标右键,下拖,选择序列,等比序列(这步不同),步长值为2,终止值x
		2.选中--->开始--->编辑--->填充--->序列
		注意:excel的初始时间是1900/1/1,代表的整数类型是1.如果涉及到时分秒,那么就使用小
		数表示 eg:1.5代表的			是1900/1/1 12:00

	工作日填充(不填周末)
		1.点击单元格鼠标右键,下拖,选择序列,日期,工作日,步长值为1,终止值x
		2.或者:开始--->编辑--->填充--->序列

	月份填充
		1.点击单元格鼠标右键,下拖,选择序列,日期,月,步长值为1,终止值x
		2.开始--->编辑--->填充--->序列

	年份填充
		同上...




	多个不连续单元格输入同一个数据
		-- 选中单元格->输入想要输入的数据->按Ctrl+回车

	文本记忆式输入(表中有的内容才可以选择表中内容填充)
		-- 鼠标右键--->从下拉列表中选择

	数据验证(单元格中只能输入指定内容)
		--数据---》数据验证---》数据验证---》允许---》序列---》来源---》选中

	数字自定义格式
		-- 开始---》字体/对齐方式/数字---》数字---》自定义---》类型---》输入---》[=1]"男";[=0]"女"
		注意:只能有两个值
	
	同时填充多个工作表
		-- 连续的单元格使用shift
		-- 不连续的单元格使用ctrl

    巧妙利用自动更正选项,快速录入数据(输入设定的内容,自动更正单元格的数据)
    	-- 文件---》选项---》校对---》自动更正选项---》自动更正---》添加

导入txt数据

 数据---》自其他来源---》自文本---》预览---》分隔符---》逗号---》确定

导入Access数据库

数据---》自其他来源---》自文本---》自Access数据库---》分隔符---》逗号---》确定

Excel数据类型

类型示例
文本姓名、职务、描述、住址…
数值年龄,0,1,2,3,4,5,6…
逻辑值True,False

错误数据类型如下:

错误值错误类型
[#####]超过单元格宽度,一般在手机号、身份证、日期等长数字时会出现。
[#VALUE!]参数类型错误 参数的数据格式错误,函数中使用的变量或参数类型错误。
[#DIV/0!]除数为0,或除数引用的单元格为空值。
[#NAME!]不能识别的文本或其他参数。
[#N/A]公式中没有可用数值,目标或参数缺失
[#REF!]引用地址失效 一般是删除了表格中个别单元格,造成公式引用地址效。
[#NULL]公式中的交集输入不正确
[#NUM!]无效数字值(无法接受的参数)

自定义数据格式

1. 开始---》字体/对齐方式/数字---》数字---》自定义---》0"元/年" 		--	整数类型 
2. 开始---》字体/对齐方式/数字---》数字---》自定义---》@"季度" 		-- 字符串/文本

给不同的数据上颜色(取异常值)

[绿色]0.0%;[红色](0.0%);[黑色]0.0			-- 百分比给绿色,括号中数据给红色,0给黑色

注意:数字格式最多可包含四个代码部分,各个部分用分号分隔。这些代码部分按先后顺序定义
	正数、负数、零值和文本的格式

文本型数字转换数值型数字(进行运算分析数据)

文本类型转数值类型的方法有六种

公式:=VALUE(单元格)
运算:=A1*1	 =A1/1   =A1+0   =A1-0   =--A1		

注意:转换完成后,才可以用公式进行运算(做数据分析)

标准化规范化

正规日期格式:1900/1/1
注意:正规日期可以进行加减法运算,不正规日期是不可以进行加减法运算的。

不规范日期1(2014.1.1)

开始---》查找和选择---》替换---》./---》全部替换
如果出现了类似二○一四年一月二日样的结构可以修改为短日期 开始---》日期---》短日期
或
=SUBSTITUTE(A3,".","/")*1		要替换的数据,替换的内容,替换的结果

不规范日期 (980102)

=--TEXT(F3,"##-##-##")
注意:(1)TEXT(F3,"##-##-##")是文本类型 (2)--是修改为日期类型 (3)开始---》日期---》短日期
或
=--TEXT(A7,"#-00-00")			替换的单元格,替换的格式

分列:固定宽度/日期格式(20140101)

选中--》数据---》分列---》日期---》完成

规范时间(122040)

=--TEXT(A10,"00!:00!:00")			-- 规范的单元格,规范后的格式 例如:12:20:40

批量删除单引号

格式刷复制一个空单元格。
复制到这个区域即可。

快速计算

ALT + =     

快速选中

Ctrl + Shift + ↓

选中不连续单元格

Ctrl + 鼠标
或
Shift + F8

选数据+复制公式

 填充柄功能:双击,复制一列同类型公式,一次几百个、几万个等

拆分冻结

1. 视图---》冻结窗格---》冻结首行 
2. 视图---》冻结窗格---》冻结首列
3. 视图---》冻结窗格---》冻结窗格(单元格)一般首行首列

选择空单元格(多个)

先选中全部,ctrl + shift ↓ →
1. 案例:将所有空格填充100 
2. 开始---》查找/选择---》定位条件---》空值---》输入数据---》ctrl+enter

复制分类汇总结果

1. 案例:复制可见单元格,不显示隐藏数据
2. 开始---》查找/选择---》定位条件---》可见单元格

选中错误单元格

1. 案例:将错误的单元格修改为0 
2. 开始---》查找/选择---》定位条件---》公式---》错误---》输入数据---》ctrl+enter

把行改为列

选中数据---》ctrl+c---》粘贴---》选择性粘贴---》转置---》确定

联动数据

选中数据---》ctrl+c---》粘贴---》选择性粘贴---》链接图片---》确定
#注意:修改源数据,复制过去的书跟着变动

选择性粘贴-将两列数据合为一列

1. 案例:将金额插入到对应部门名称下面 
2. 创建辅助列---》添加对应数量的整数---》添加对应数量的小数---》数据---》升序---》扩展选定区域---》 复制右栏数据到左栏数据(从第二个空单元格粘贴)---》粘贴---》选择性粘贴---》跳过空单元 
3. 注意:整数数量和小数数量都要保证数据完整性

单元格匹配替换

1. 案例:将0替换为补考 

2. 开始---》查找和选择---》替换---》单元格匹配---》全部替换

辅助列-隔行插入1空行

1. 案例:给每一列车次上都要添加一个标题 
2. 添加辅助列整数数据---》添加辅助列小数数据---》数据---》升序---》复制添加内容---》开始 查找或选择---》定位条件---》空值---》确定---》粘贴

数据验证-多行变一行(整张表的数据范围添加进去)

前提:序列只能添加一列。 
案例:数据---》数据验证---》序列---》来源---》一列---》完成

1. 案例:多行多列放在一个下拉选框
2. 公式---》名称管理器---》新建---》名字---》单列(特殊注意)---》数据---》数据验证---》序列---》=QF ---》公式---》名称管理器---》编辑---》全选中---》完成
注意:顺序不能错,开始设置名称多行多列,不成功

圈释无效数据

案例:圈出非1到10之间的数据
数据---》数据验证---》整数---》1到10---》圈出无效数据
注意:第一次圈出的范围

快速填充

1. 方案1:下拉到底部,快速填充 
2. 方案2:ctrl+e
注意:也可以直接在汉字中提取数字进行填充

分列-源数据(去重)

1. 案例:查询有多少国家参加世界杯 
2. 实现:1. 将VS替换成, 开始---》查找和选择---》替换 
3. 按,分列 数据---》分列---》逗号 
4. 将第二列剪切到第一列后面 
5. 数据---》删除重复值

数据整理

案例:将爬取的歌单输入到excel中 
 实现:
 数据---》分列---》.---》完成 
 复制数据---》粘贴---》转置 
 快速填充/ctrl+e 
 如果有特殊字符可以使用替换 eg:(藏语---》(藏语)

全年合并

 案例:将上半年和下半年的数据合并计算
   实现:
   数据---》合并计算---》添加---》首行---》左列---》确定
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

像风一样的男人@

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值