读书笔记:《谁说菜鸟不会数据分析-入门篇》第1-4章

读书笔记:《谁说菜鸟不会数据分析-入门篇》

第一章:数据分析是神马
数据分析分类:
1、数据分析分类:
描述性数据分析:常见方法:对比分析法、平均分析法、交叉分析法
探索性数据分析–发现数据中的新特征;常见分析方法:相关分析、因子分析、回归分析
验证性数据分析–验证已有假设的真伪
2、数据分析在企业日常经营中的三大作用:
现状分析–目前的经营、运营状态–日报、周报、月报等
原因分析–针对某一现状分析原因
预测分析
3、数据分析6步曲:
明确分析目的和思路–数据收集–数据处理–数据分析–数据展现–报告撰写
(1)分析框架体系化:以营销、管理等理论为主导,结合业务情况
营销方面的理论:4P、用户使用行为、STP理论、SWOT等
管理方面理论:PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则
(2)数据来源:数据库、公开出版物、互联网、市场调查
(3)数据处理:数据清洗、数据转化、数据提取、数据计算
(4)数据分析工具–EXCEL,SPSS,PYTHON等
数据挖掘:分类、聚类、关联、预测–重点在于寻找模式和规律
基本分析方法:对比分析、分组分析、交叉分析、结构分析、漏斗图分析、综合评价分析、因素分析、矩阵关联分析等
高级分析方法:相关分析、回归分析、聚类分析、判别分析、主成分分析、因子分析、对应分析、时间序列
4、几个常用指标及术语:
平均数–算数平均数
绝对数、相对数–相对数=比较数值/基础数值
百分比、百分点
频数、频率
倍数、番数–原来数量的2的N次方倍(翻一番)
同比–与历史同期进行比较;环比–与前一个统计期对比

第二章:结构为王–确定数据分析思路
1、数据分析方法论作用:理顺分析思路,确保数据分析结构体系化;把问题分解成相关联的部分,并显示它们之前的关系;为后续数据分析的开展指引方向;确保分析结果的有效性及正确性。
2、常用的数据分析方法论:
(1)PEST分析法:
用于宏观分析,对于四大类影响企业外部环境的因素:政治(Political)、经济(economic)、技术(technological)、社会(social)
a、政治环境的关键指标有:政治体制、经济体制、财政政策、税收政策、产业政策、投资政策、专利数量、国防开支水平、政府补贴水平、民众对政治的参与程度。
b、经济环境:分为宏观经济环境和微观经济环境
宏观经济环境是指一个国家的GDP\GNP等,反应国民经济发展水平和发展速度。
微观经济环境是指企业所在地区的消费者收入水平、消费偏好、储蓄情况、就业程度等,决定企业目前及未来的市场大小。
关键经济指标有:GDP及其增长率、进出口总额及其增长率、利率、汇率、通货膨胀率、消费价格指数、居民可支配收入、失业率、劳动生产率等。
c、社会文化环境关键指标:人口规模、性别比例、年龄结构、出生率、死亡率、种族结构、妇女生育率、生活方式、购买习惯、教育情况、城市特点、宗教信仰等
d、技术环境关键指标:新技术的发明和进展、折旧和报废速度、技术更新速度、技术传播速度、技术商品化速度、国家重点支持项目、国家投入研发费用、专利个数、专利保护情况等
(2)5W2H分析法
何因(why)何事(what)何人(who)何时(when)何地(where)如何做(how)何价(how much)
(3)逻辑树分析法
问题分析的常用工具,将问题的所有子问题分层罗列,逐笔向下拓展。
eg:在这里插入图片描述
使用原则:要素化、框架化、关联化–不重不漏
(4)4P营销理论
随着营销组合理论产生,把营销组合理论里面的要素概括为4类:产品(product)、价格(price)、渠道(place)和促销(promotion)
a、产品包括有形产品、服务、人员、组织、观念等
b、价格包括:基本价格、折扣价格、支付期限等
影响定价的主要因素:需求、成本、竞争
c、渠道:产品从生产企业到用户手上的全过程
d、促销:广告、推广宣传、人员推销、促销等
(5)用户行为理论
用户行为的完整过程:认知-熟悉-试用-使用-忠诚
在这里插入图片描述
总结:PEST主要用于行业分析
4P理论主要用于公司整体营运情况分析
逻辑树用于业务问题专题分析
用户行为理论用于用户行为分析
5W2H可用于用户行为、业务分析等

第三章:巧妇难为无米之炊-数据准备
1、理解数据
字段与记录、数据类型–文字与文字、数据表、二维表与一维表转换(数据透视表)
2、数据来源
导入数据–分列、来自网站导入等
问卷录入要求–数值题、单选题(1、2、3、4)、多选题(01或者数字)、排序题(1、2、3。。。)、开放性文字题(分类录入)

第四章:三心二意-数据处理
1、数据处理的内容:数据清洗、数据加工
2、数据清洗
(1)重复数据的处理
a.函数:COUNTIF(range,计算条件)
b.高级筛选–不重复的数据
c.数据透视表
d.删除重复数据
(2)缺失数据的处理–定位输入(ctrl+G)-可定位空值
a.用样本统计量的值替代缺失值,如样本均值
b.应统计模型计算结果替代缺失值,如回归模型、判别模型等
c.将缺失值的记录删除–会导致样本量变少
d.保留缺失值记录,仅在分析时做必要排除
----利用ctrl+enter快捷键,可以一键在选中的单元格内用一样的公式或者一样的内容
(3)检查数据逻辑错误
a.IF函数–IF(逻辑表达式结果为TRUE或者FALSE,为TRUE时返回的值,为FALSE时返回的值)
b.用条件格式标记错误
3、数据加工
(1)数据抽取–提取字段中某些信息
a.字段分列
b.函数法:LEFT(待提取的字段,指定字符数量)–提取字符串左边指定个数的字符
RIGHT(待提取的字段,指定字符数量)–提取字符串右边指定个数的字符
CONCATENATE(TEXT1,TEXT2…)–J将几个文本字符合并为一个文本字符串
Vlookup(查找值,查找范围,希望返回匹配的列数,是否精确匹配)
(2)数据计算
a.简单计算
b.函数计算-AVERAGE\SUM\TODAY\NOW\DATE\MONTH\DAY\DATEDIF(返回两个日期的间隔天数)
(3)数据分组–VLOOKUP(模糊匹配)
(4)数据转换
a.行列转换–选择性粘贴-转置
b.Hlookup-按行查找,用法与Vlookup类似
Isnumber-看是否是数值,是返回true,不是返回false
Seach(要查找的字符串、要在那个字符串中查找、从第几个字符串开始查找)-返回指定字符串在原始字符串中首次出现的位置
4、数据抽样
Rand()-返回[0,1]均匀分布随机数

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值