![08c8614e69d93019989c45f6d2af6343.png](https://i-blog.csdnimg.cn/blog_migrate/b17b8adf95f2c624019194d176fe7b09.jpeg)
笔记内容来源:拉勾教育数据分析实战训练营
我是一个在教育留学行业8年的老兵,受疫情的影响留学行业受挫严重,让我也不得不积极寻找新的职业出路。虽然我本身是留学行业,但对数据分析一直有浓厚的兴趣,日常工作中也会做一些数据的复盘分析项目。加上我在留学行业对于各专业的通透了解,自2016年起,在各国新兴的专业--商业分析、数据科学都是基于大数据分析的专业,受到留学生的火爆欢迎,可见各行各业对于数据分析的人才缺口比较大,所以数据分析被我作为跨领域/转岗的首选。对于已到而立之年的我,这是一个重要的转折点,所以我要反复对比课程内容选择最好的,在7月中旬接触刚拉勾教育的小静老师后,她给我详细介绍了数据分析实战训练营训练营的情况,但我并没有在一开始就直接作出决定。除了拉勾教育之外,我还同时对比了另外几个同期要开设的数据分析训练营的课程,但对比完之后,基于以下几点,我最终付费报名了拉勾教育的数据分析实战训练营:
1、课程体系最全面:课程内容有分析方法论、分析方法、Excel、Mysql、Tableau、Quick BI、神策平台、Hive、统计学、Python、挖掘算法、Spss等,是目前我看到的最全面的。
2、课程体系把握行业人才需求痛点:拉勾主营业务是招聘,最明白企业的人才需求,基于此设计的课程体系是比较贴近实际需求的。通过5个月周期10个阶段,从现状统计到预测分析、从业务数据到编程工具处理复杂业务逻辑数据,实现用数据驱动业务,辅助决策,提升公司业绩。
3、课程学习模式灵活:大部分授课采用录播方式,学习完成后还有直播答疑。比直播打卡更容易安排自己的时间。
4、课程学习过程和结果有保障:学习成果作业检测+实时答疑+班主任督导,每个阶段每个模块的知识学完的作业可以锻炼实操。
5、项目实战内容丰富:也是我我最看好的一点,涵盖了在线教育、电商等多个领域多个项目实战。
6、就业辅导+优秀内推:拉勾平台是互联网行业招聘大本营,这是天然优势。
学习过程亲身感受
目前为止已经学习了近4个月的课程,已经学完Excel、数据分析思维、MySQL、Tableau、quickBI、神策、hive、统计学,每一阶段每一模块的知识都是在线自主学习,完成作业后解锁新课程,直播课会根据全体学员进度,收集疑问然后进行在线直播内容回顾和答疑以及作业讲解。每位讲师都很优秀,都有自己的授课特色所在,内容都是很干货的录好的内容,有些内容导师还会重新录制,不断迭代让学员达到更好的学习体验。作业批改、答疑导师西蒙(我接触最多的,经常麻烦他帮我解决问题)和班主任团子比较nice,认真负责,他们分别负责技术答疑和服务类的问题,平时有问题可以在微信群里问,可以单独聊也可以群里问,他们全天非工作日也会答疑。
这里面我印象最深刻的是SQL的授课老师应颠老师(也很遗憾只知道这位老师的名字),讲解由浅到深,思路非常清晰,对于代码的剖析过程有非常详细的注释,让我这样的小白能够很好的吸收知识。 最开始报名的时候说每周8-12小时足够,但现在看来我每周需要花更多的时间去攻克这些知识点,所以课程是性价比非常高了。每天松懈的时候一看到课表要求的进度,就不断促使我继续坚持学习按照进度来。
统计- 学习笔记归纳
一、卡方检验
假设检验的结论:ρ<0.05,则研究假设成立;反之,p>0.05则研究假设不成立.
卡方检验的重要性
适用于不知道总体参数的检验,是最常用的一种非参数检验。 当不适用参数检验法时,第一个想到的就是卡方检验。
卡方检验的应用场景
以SPSS自带数据telco.sav为例:
1、比例分布检验
检验一个变量中取值的比例分布是否均匀,或者是否符合设定比例分布。
原假设:变量的取值分布与均匀分布(或研究者设定的分布)没有显著差异
研究假设:变量的取值分布与均匀分布(或研究者设定的分布)有显著差异
p<0.05,则研究假设成立。
例:确定一袋糖豆是否包含相等比例的蓝色、棕色、绿色、橙色红色和黄色糖果。也可以检验一袋糖豆是否包含5%蓝色、30%棕色、10%绿色、20%橙色、15%红色和15%黄色的糖果
SPSS操作:分析-非参数检验-旧对话框-卡方
如果只检验前3种,下限1,上限3
![58d0fc6243c2327fe6556782e5c4a86a.png](https://i-blog.csdnimg.cn/blog_migrate/59a3852ace458e3965efec7c6128bc15.jpeg)
![4d125557551d56b6cf7d7cc3b7ffde8a.png](https://i-blog.csdnimg.cn/blog_migrate/178d3c19bcc2a791abae26dde1d1f76f.jpeg)
![b2e2a579a000093075efabb65071bd2e.png](https://i-blog.csdnimg.cn/blog_migrate/545c9a15fee781380d5c80bc46bc219e.png)
2、二项式检验
检验一个变量取二分类两个值的概率是否符合设定的概率。
原假设:变量的第一个取值比例与设定比例没有显著差异
研究假设:变量的第一个取值比例与设定比例有显著差异
p<0.05,则研究假设成立。
例:当您掷出一枚硬币,正面朝上的概率为1/2。根据这一假设将硬币抛掷40次,并记录结果(正面朝上和反面朝上的情况)从二项式检验中,您可能发现,3/4的抛掷都是正面朝上,且观测的显著水平很小(0.0027)。这些结果表明,正面朝上的概率不可能等于1/2;硬币可能是有偏倚的。
SPSS操作:分析-非参数检验-旧对话框-二项
分割点:是将一个连续变量,选择一个值分割为大于该值和小于该值。
![02a34d229814ea23ba1fdfc6e656ff84.png](https://i-blog.csdnimg.cn/blog_migrate/d752e7b43f1002ee09ab1edb74bb7594.png)
3、K-S检验
检验样本来自的总体中,一个变量的分布是否服从正态分布、均匀分布、泊松分布、指数分布
原假设:变量来自总体的分布与正态分布(或均匀分布等)没有显著差异,即变量在总体中呈现正态分布(或均匀分布等)
研究假设:变量来自总体的分布与正态分布(或均匀分布等)有显著差异,即变量在总体中不呈现正态分布(或均匀分布等)
p<0.05,则研究假设成立。
SPSS操作:分析-非参数检验-旧对话框-单样本K-S
![1010418cd47c923626970f3001bfe8ad.png](https://i-blog.csdnimg.cn/blog_migrate/20a4c8f6d1dc23d61ba5e4e7723d246b.png)
4、游程检验
检验一个变量的两个取值出现顺序是否随机。两个值出现比例各占50%