1.需要提前安装的包
2.数据处理
进行数据处理前,我们需要知道我们最终想要的数据是什么样的,因为我们是想分析候选人与捐赠人之间的关系,所以我们想要一张数据表中有捐赠人与候选人一一对应的关系,所以需要将目前的三张数据表进行一一关联,汇总到需要的数据。
数据说明
- CAND_NAME – 接受捐赠的候选人姓名
- 名称 – 捐赠人姓名
- STATE – 捐赠人所在州
- EMPLOYER – 捐赠人所在公司
- OCCUPATION – 捐赠人职业
- TRANSACTION_AMT – 捐赠数额(美元)
- TRANSACTION_DT – 收到捐款的日期
- CAND_PTY_AFFILIATION – 候选人党派
3.数据探索与清洗
进过数据处理部分,我们获得了可用的数据集,现在我们可以利用调用属性查看数据的规模,调用函数查看数据信息,调用函数查看数据分布。
4.数据分析
5.数据可视化