学习目标:
模型建立和评估
学习内容:
对task01-04学习内容整合
学习产出:
了解数据分析的一般流程:
1、熟悉分析工具:Python与Excel
2、明确目的:分析什么,如存活率影响因素
3、获取数据:在哪提取数据(微博、官网等渠道),获取那些指标,什么时间段
4、熟悉数据:类别型(文本型)特征和数值型特征
5、处理数据:通过info查看缺失值,填充(0、中位数、众数)或者删除;describe用于生成描述性统计数据;对异常、重复数的处理
6、分析数据:数据模型建立
7、得出结论
8、验证结论
9、展示结论:数据可视化