一、数据分析步骤
1. 【明确问题】
我们要分析哪些业务指标?
案例:数据分析在哪个城市工作机会比较大? 数据分析薪水如何?根据工作经验的不同,薪酬是怎样变化的?
2. 【理解数据】
(1)熟悉 Excel 的工作界面
(2)Excel各个字段表示什么含义? (含操作)
自动换行:【开始】-【自动换行】
列宽:选定整列-鼠标右击-【列宽】-输入列宽数字
单元格格式:选定单元格-鼠标右击-【设置单元格格式】-选择数据类型
隐藏列:选定整列-在列号上鼠标右击-【隐藏】
取消隐藏行(列): 全选表格-【开始】-【格式】-【隐藏和取消隐藏】-【取消隐藏行(列)】
查找:ctrl+d或者【开始】-【查找和选择】-【查找】-输入查找内容
替换:ctrl+h或者【开始】-【查找和选择】-【替换】-输入查找内容和替换为的内容
(3) Excel中有哪些数据类型?
注意:字符串类型不能计算;表格中数字如“123”在单元格中时,需要判断其实哪种类型。一般情况下,默认字符串类型是左对齐,数字类型是右对齐。
(4)数据的基本操作.……
3. 【数据清洗】
(1) 删除重复数据:【数据】-【删除重复项】-【取消全选】- 选择需要删除的列
(2)缺失值处理:查找到空格,人工手动补全(只适合缺失比较少);删除缺失的数据;用平均值代替缺失值;用统计模型计算出的值代替缺失值。
「如何统计缺失了多少数据?」
所选列的缺失数据= 选定最全列(看总行数)- 选定所选列(看总行数)
「如何定位到所有缺失值?」
定位缺失值:选定范围-【开始】-【查找和选择】- 【定位条件】-选择【空值】
「如何用人工一次性补全所有缺失值?」
定位缺失值,在空格输入要录入的内容,按住Ctrl+Enter,即可一次性补全空格。
(3)一致化处理:
分列:选定整列-右击【复制】-粘贴到最后一列-右击【粘贴】-选定最后一列-【数据】- 【分列】-【分隔符号】-下一步使用分割符号进行分割如“,”-选择列数据格式
「如何计算平均值」
选定单元格-【公式】-【插入函数】-【查找函数:平均值】-【选择函数:AVERAGE】-选定或输入需要被平均的区域
「如何计算平均薪水?」
把薪水范围分成最低薪水和最高薪水,应用函数公式,然后计算在最低薪水和最高心水的平均值。
「如何将函数应用到一整列? 」
自动填充函数:鼠标放到单元格右下角自动变成十字架形状-双击十字架套用到整列数据上
(4)数据排序:
排序:【数据】-【排序和筛选】-选择【升序】【降序】或【自定义排序】
筛选:【数据】-【排序和筛选】-勾选出要选的内容,如错误值VALUE
其他:
(1)Excel中常用的函数如何使用?
求单元格平均值:average:选中函数单元格-【公式】-【插入函数】-【搜索函数】“平均值”-选择AVERAGE-选择函数要输入的数据
查找字符串在单元格中的位置:FIND(要查找的字符串,字符串所在单元格位置)
截取字符串:LEFT(字符串所在单元格位置,从 左开始 到XX位置进行截取)
截取字符串:RIGHT(字符串所在单元格位置,从 右开始 到XX位置进行截取)
截取字符串:MID(字符串所在单元格位置,开始位置,截取长度)
字符串长度:LEN(字符串所在单元格)
单元格中数据个数技术:COUNT(value1,value2, ...)
查找:vlookup(找什么,在哪找,第几列,是准确找还是近似找0/1)
(2)如何规范数据源中错误格式的值?
用筛选功能筛选出整列的错误值value,点击黄色感叹号找到错误原因,对症更根据具体原因更改。
(3) 如何拆分单元格?
【数据】-【分列】-【分隔符号】-下一步使用分割符号进行分割如“,”-选择列数据格式。
(4)时间格式数据如何处理?
选定整列-【数据】-【分列】-【分隔符号】-【连续分隔符号视为单个处理】-列数据格式【日期】
选定整列右击-【设置单元格格式】-【自定义】-yyyy-m(m)-d(d)
4. 【数据分析或构建模型】
(1)如何获取业务指标?
搭建数据透视表,分析工具库,vlookup
(2)如何搭建数据透视表?
【插入】-【数据透视表】-【选择一个表或区域】【新工作表】-讲不同字段拖到相应的【筛选】【行】【列】【值】中
(3)如何使用vlookup进行数据分析?
选定单元格-【公式】-【插入函数】-搜索函数vlookup-vlookup(找什么,在哪找,第几列,是准确找还是近似找0/1)
准确查找(找到第一个匹配值就停止查询)
模糊查找(查找所以的值返回的是最后一个匹配值)
vlookup的弱点:如果有重复的内容,只能返回到第一个匹配的值,或者是最后一个匹配的值。
解决办法:添加辅助列
(4)相对引用,混合引用,绝对引用
(5)如何使用搜索引擎解决遇到的问题?
未完待续
5. 【数据可视化】
未完待续
二、项目实战:招聘网站信息分析
- 哪些城市对数据分析师职位的需求量比较大?
(从结果上看:北京、上海、深圳、广州、杭州……)
- 数据分析师在不同城市的平均薪资对比
(从结果上看:深圳、北京、上海、杭州、苏州……)
- 找到数据分析师工作需要哪些技能?
未完待续