一:介绍
该案例来自《利用Python进行数据分析·第2版》,分析的对象为对2012年美国大选的数据集,其中包括赞助者的姓名、职业、雇主、地址以及出资额等信息。
二:分析流程
1:读取数据
fec= pd.read_csv('C:/Users/17322/Desktop/datasets/fec/P00000001-ALL.csv')
2:预处理
(1)添加两派信息
提取候选人名单
unique_cands=fec.cand_nm.unique()
unique_cands
候选人两派信息
parties={'Bachmann, Michelle':'Republican',
'Cain, Herman':'Republican',
'Gingrich, Newt':'Republican',
'Huntsman, Jon':'Republican',
'Johnson, GaryEarl':'Republican',
'McCotter, ThaddeusG':'Republican',
'Obama, Barack':'Democrat',
'Paul, Ron':'Republican',
'Pawlenty, Timothy':'Republican',
'Perry, Rick':'Republican',
"Roemer, CharlesE.'Buddy'III":'Republican',
'Romney, Mitt':'Republican',
'Santorum, Rick':'Republican'}
用map方法新建‘Party’的列
fec['party'] = fec.cand_nm.map(parties)
fec['party'].value_counts()
可看到两派各自的赞助人数