![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
学习
BaideS
这个作者很懒,什么都没留下…
展开
-
数据分析报告的通用结构
根据阅读《数据分析师养成宝典》及个人理解后所得。完成一份数据分析报告的整个流程:明确业务目标;数据准备;数据指标与分析;撰写分析报告;明确业务目标了解必须的业务信息,明确问题类型,因为不同的问题类型,要解决的问题不同。问题类型必解决的问题可延伸的问题描述类发生了什么事无因果类发生了什么事,为什么会发生无预测类发生了什么事,未来会如何发展为什么会发生咨询类发生了什么事,该如何应对为什么会发生,未来会如何发展数据准备目标是识别出原创 2020-09-15 22:27:59 · 3619 阅读 · 0 评论 -
Ubuntu16.04 Spark2.7.7伪分布式从零开始部署
因工作上的需要,尝试在一台Ubuntu16.04部署Spark,因为之前没有了解过Spark,故踩坑时部署了Local版和Standalone单机伪分布式版,现记录如下。因为在部署Spark之前并未明确出Spark是什么,踩了相应的坑,故在此一并说明:Spark的目标是做一个分布式计算框架,因为是分布式所以它需要通讯(故需要安装SSH),有因为只是一个计算框架,所以其分布式数据来源需要由Hadoop的HDFS提供(故需要安装Hadoop),缺少SSH和HDFS,哪怕跑通,也是Local版。1. Spar原创 2020-08-28 17:14:01 · 342 阅读 · 0 评论