数据分析概论
一、概念和意义
-
概念
-
数据分析是指,通过恰当的统计方法和可行的的分析手段,对数据进行收集和汇总,然后加工处理。然后对有效数据进行分析,发现问题,发掘可行方案,从而帮助人们采取更科学的行动
-
一切为分析信息提供的有效数据,均是数据,文字、图形、行为方式等等。
-
-
类型
-
描述性统计分析:概括,表述事物关系
-
探索性数据分析:发现数据特征
-
验证性数据分析:对假设进行验证
-
二、数据分析步骤
-
明确目标
确定目标,围绕目标展开分析工作,并选择相关有效的分析方式和分析工具。
-
数据收集
数据收集有以下途径:
-
内部数据库:公司、企业自开始建立的数据库
-
互联网:利用搜索引擎,在各个平台收集数据
-
出版物:许多官方出版物,如《中国统计年鉴》
-
市场调查:可以保证数据的时效性和真实性,问卷调查、观察调查、走访调查。
-
购买数据:互联网上很多专业的数据机构
-
-
数据处理
-
目的:提高数据质量,经过处理的数据更加准确、更有规律。
-
方法:检查、清洗、转换、提取、计算。
-
数据检查:准确性检验、逻辑检查
-
条件格式检查数据
-
-
数据清洗:删除错误数据、多余数据、重复数据
-
去重三种方法:
-
数据—>删除重复项—>单元格同时删除
-
排序重复数据的单元格区域—>手动删除
-
条件格式删除—>显示
-
-
-
数据转换:格式转换、单位转换
-
转置
复制—>选择性粘贴—>转置
-
-
数据提取:重点数据、最大/最小数据
-
数据分组:特点相同的数据分为一组
-
VLOOKUP
-
Look_value:查找的值
-
table_array:数据表区域
-
col_index_num:填数值,代表意思是根据第几列的数据显示
-
range_lookup:模糊匹配或者精确匹配,可以不填
-
-
数据拆分
-
数据—>分列
-
-
数据重组
-
& 连接符
-
TEXT函数 :将数据转换为文本形式
-
CONCATENATE函数:将单元格数据连接成文本(CONCATENATE(A1,B1))
-
-
数据抽取
-
LEFT():获取文本从左边开始第指定的字符
-
-
-
数据计算:求和、平均值
-
-
-
数据分析
-
运用多种工具
-
透视表
-
excel中的数据分析工具
-
专业的数据分析思维:关联思维、对比思维
-
常用的分析方法:PEST分析方法、4P理论
-
-
分析思路
-
分析现状
对比分析/平均分析/总量分析/占有率分析
-
分析原因
结构分析/漏斗图分析/关联分析/分组分析
-
进行预测
回归分析/时间进程/决策树/神经网络
-
-
-
数据展现
-
目的
-
从枯燥数据中发现规律
-
直观展现,更好理解数据
-
-
-
数据报告
-
一份神形兼备的数据报告
-
完善的内容
-
框架完整
报告封面/目录/报告详述/结论和建议
-
逻辑性强
-
熟悉业务
-
数据可靠
-
-
合理的表达
-
可读性强
-
直观化
-
简明扼要
-
-
-
工具
-
通常情况,使用word和powerpoint撰写静态熬膏
-
必要情况,使用excel撰写动态报告
-
或者使用VBA语言直接撰写PPT动态报告
-
-
word报告和PPT报告的区别
-
word报告:内容更详尽,没有遗漏
-
ppt报告:图形为主,文字为辅
-
-
报告自动化
-
数据不是一成不变的,数据要静态和动态相结合,展示即使的数据和数据变化。
-
ppt可以插入、连接excel动态数据表格
-
powerpoint本身可以使用VBA制作动态数据报告
-
-
三、专业术语及其他
-
平均数
总量处以总个数,各个数据与平均数的大小关系,重要指标。
-
众数
-
一组数据中出现次数最多的数值,可以存在多个众数。
-
有一个众数,单峰/有两个众数,双峰/三个众数,三峰
-
每个数字只出现一次,没有众数
-
-
中位数
-
数据从大到小排序,处在中间的数值的一个值(或者两个值的平均数)
-
-
绝对值和相对值
-
绝对值,某时间段的业务量大小
-
相对值,与其他部门业务量的大小比较
-
-
百分比和百分点
-
50%
-
50百分点
-
-
比例和比率
-
比例:部分/整体
-
比率:部分/另一部分
-
-
同比和环比
-
同比:今年第一季度和去年第一季度比
-
环比:今年第一季度和今年第二季度比
-
-
五种分析模型
-
SWOT模型中
-
分为内部因素和外部因素。内部因素包括,S代表 strength(优势),W代表weakness(劣势 );外部因素包括,O代表opportunity(机会),T代表threat(威胁)。
-
SWOT模型又称态势分析法,该模型是20世纪80年代初由旧金山大学的管理学教授提出,是一种能够较客观而准确地分析和研究一个单位现实情况的方法。
-
-
PEST模型
-
是企业宏观环境的分析模型,其中,P是政治(politics),E是经济(economy),S是社会(society) ,T是技术(technology)。
-
该模型适合用来分析企业集团所处的客观背景
-
-
5W2H模型
-
七问分析法,该模型简单、方便、容易理解,且富有启发意义。广泛应用于企业问题分析、决策措施的寻找、疏漏问题弥补等情况的数据分析
-
-
4P营销理论模型
-
产生于20世纪60年代的美国, 该模型常用于企业营销状况 分析、商品销售策略分析。
-
产品(Product)、价格(Price)、渠道(Place)、宣传(Promotion)。
-
-
-
通用分析模型
-
逻辑树模型又称问题树、演绎树或分解树模型。是一种通用的分析模型,广泛适合于各种情况下的问题分析,作用在于层层分解、追本溯源,找到问题的症结所在。
-
逻辑树的基本结构是,从最高层开始,逐步向下扩展分解。即将一个已知的大问题当成最高层,然后考虑与该问题
-
相关的因素,每考虑到一个点,就添加一根“树枝”,以此类推,将每个问题都细化到最小处,最终形成一颗“逻辑树
-
-
优秀学习网站
-
艾瑞网
-
学习分析思路、报告撰写方法 http://www.iresearch.cn/
-
数据分析网站,其团队深入互联网等相关领域进行数据分析,为业内人士提供丰富的产业资讯、数据、报告、观点等内容。在艾瑞网中,可以看到专业的数据分析报告,从这些报告中可以学 习其分析思路和规范报告的撰写方法
-
-
网易数度
-
网易数读通过深度挖掘数据,为读者提供数据新闻。网易数读的数据新闻不仅“用数据说话”,还 借助图表、设计图等形式,让数据变得美观、有趣。其数据呈现方式十分值得借鉴。
-
UED
-
学习数据分析在用户研究上的应用http://www.aliued.com/
-
阿里巴巴中文站UED是阿里巴巴集团资深的用户体验设计部门。在UED网站中,提供了关于用户 体验设计及研究的数据资讯。其中包括了如何通过数据分析来提升用户体验、解决用户需求,从而让数据 分析在商业中得到实际运用。
-
-
-
excel常用工具
-
易用宝
-
是Excel功能扩展工具,可以有效提升Excel的操作效率。针对Excel软件在数据处理与分析过 程中的多项常用需求,Excel易用宝集成了数十个功能模块,从而让繁琐或难以实现的操作变得简单可行 ,甚至能够一键完成。
-
合并工作表功能,使用易用宝,可以批 量合成不同文件中的工作表。
-
-
金数据
-
在线制作调查问卷,并轻松收集统计数据。
-
-
问卷星
-
在线测评、调查系统,任何人都可以使用问卷星自主设计调查问卷,让人们通过网络 参与问卷调查,从而快速收集到调查数据
-
-
四、数据分析思路
-
思路
-
预测
-
实质是根据现在和过去的数据进行未来趋势预测,这里有两个关键点,一是数据在时间上的连续性,二是数据的数量,三是数据的全面性,时间点上的数据越多、连续性越高、全面性越好,预测结果越准确。
-
预测分析的思路可为各类企业、政府等机构提供确定未来结果的信息,帮助各类机构权衡不同决策方向的效果,并提前采取预防措施。
-
定性预测法、数学模型法、模拟模型法
-
-
交叉
-
建立在纵向分析法和横向分析法的基础上,从数据交叉的点出发,进行数据分析。
-
理清数据间的关系/快速分析每个交叉点的值/方便地对数值进行求和计算/将注意力集中在目标数据项上。
-
-
假设/对比/分组/概率/平均/指标综合杜邦分析/漏斗分析/象限分析
-
-
工具
-
数据透视表
-
图表
-
迷你图
-
条件格式
-
分类汇总
-
Power
-