天池龙珠计划Python训练营–Task04重点记录
项目名称
利用Pandas分析美国选民总统喜好
数据集
所有候选人信息
CAND_ID 候选人ID
CAND_NAME 候选人姓名
CAND_PTY_AFFILIATION 候选人党派
候选人委员会链接信息
CAND_ID 候选人ID
CAND_ELECTION_YR 候选人选举年份
CMTE_ID 委员会ID
个人捐款档案信息
CMTE_ID 委员会ID
NAME 捐款人姓名
CITY 捐款人所在市
State 捐款人所在州
EMPLOYER 捐款人雇主/公司
OCCUPATION 捐款人职业
数据处理
将委员会和候选人一一对应,通过CAND_ID关联两个表
由于候选人和委员会的联系表中无候选人姓名,只有候选人ID(CAND_ID),所以需要通过CAND_ID从候选人表中获取到候选人姓名,最终得到候选人与委员会联系表ccl。
将候选人和捐赠人一一对应,通过CMTE_ID关联两个表
通过CMTE_ID将目前处理好的候选人和委员会关系表与人捐款档案表进行关联,得到候选人与捐赠人一一对应联系表cil。
数据分析
- 计算前十位党派和总统候选人获得的捐款总额
- 不同职业的人捐款的总额,然后排序,取前十位
- 以及不同捐款人的数量
- 每个州捐款总额和捐款人的数量
数据可视化
- 导入相关Python库
- 按州总捐款数和总捐款人数柱状图
- 各州捐款总人数可视化
- 热门候选人拜登在各州的获得的捐赠占比
- 总捐最多的候选人捐赠者词云图