Step1:目标确定
这一步在工作中通常是由你的客户/上级/其他部门同事/合作方提出来的
第一次的数据报告需要自己来提出并确定目标,选择目标时,需要注意的点:
选择一个比较熟悉,或者比较感兴趣的领域/行业
选择一个范围比较小的细分领域/细分行业作为切入点
确定这个领域/行业有公开发表的数据/可以获取的UGC内容(论坛帖子,用户点评等)
Step2:数据获取
1.公开数据
统计局网站,各类行业网站等
百度输入关键字就行了
2.爬虫
Step3:数据清洗
在工作中,90%的情况都是在做清洗工作,排除异常值,空白值,无效值,重复值等
Step4:描述分析
这是实际工作中应用最广的分析方法
分为两部分:数据描述和指标统计
数据描述:用来对数据进行基本情况的刻画,包括:数据总数,时间跨度,时间粒度,空间范围,空间粒度,数据来源,数据的极值,分布,离散度等
指标统计:用来做报告,分析实际情况的数据指标,包括变化,分布,对比,预测
变化:指标随时间的变动,表现为增幅(同比,环比等)