python数据分析基础
一 Numpy数据处理库
二 Pandas数据处理库
三 Matplotlib库
四 Seaborn库
五 Pyecharts库
六 机器学习
七 绝地求生和黑色星期五
数据分析的基本流程
学数据分析之前应该明白整个数据分析的基本流程:
1.明确需求与目的
2.数据收集
- 内部数据
- 购买数据
- 爬取数据
- 调查问卷
3.数据预处理
- 数据清洗:缺失值、异常值、重复值
- 数据转换与特征工程
4.数据分析
- 描述分析
- 推断分析
- 数据建模
- 数据可视化
5.编写报告
基础概念:
假设检验,也称为显著性检验,是通过样本的统计量,来判断与总体参数之间是否存在差异(差异是否显著).即我们对总体参数进行一定的假设,然后通过收集到的数据,来验证我们之前作出的假设(总体参数)是否合理。
在假设检验中,我们会建立两个完全对立的假设,分别为原假设(零假设) Ho与备则假设(对立假设) H。然后根据样本信息进行分析判断,是选择接受(维持)原假设还是拒绝原假设(接受备择假设)。假设检验基于“反证法"。
首先,我们会假设原假设为真,如果在此基础上,得出了违反逻辑与常理的结论,则表明原假设是错误的,我们就接受备择假设。否则,我们就没有充分的理由推翻原假设,此时,我们选择去接受原假设。