AI基础_pandas数据分析实战

AI基础__天池pandas数据分析学习赛

1. 数据准备

数据可以在赛事指南中按照文档描述进行下载,一共需要以下三个数据集.

数据的预处理,官方给了一个baseline.

2. 数据分析

根据数据准备阶段得到的数据.现在的数据结果如下.

image-20210304204116315

其中,各个字段的意思如下:

  • CAND_PTY_AFFILIATION 党派名称

2.1 党派分析

下面计算各个党派所获得的捐款总额:

c_itcont.groupby('CAND_PTY_AFFILIATION').sum()

可以得到如下的结果:

image-20210304204627198

对其进行排序:

c_itcont.groupby('CAND_PTY_AFFILIATION').sum().sort_values('TRANSACTION_AMT',ascending=False)
image-20210304204849611

2.2 候选人分析

c_itcont.groupby('CAND_NAME').sum()

所有候选人所获得的捐款信息如下:

image-20210304205137718

再对其进行排序,取前10个总统候选人

c_itcont.groupby('CAND_NAME').sum().sort_values('TRANSACTION_AMT',ascending=False).head(10)
image-20210304205331214

可见,得到捐款最多的是拜登.其次是特朗普.

2.3 职业分析

c_itcont.groupby('EMPLOYER').sum().sort_values('TRANSACTION_AMT',ascending=False)
image-20210304210359423

可见,其实没有工作的人是捐的最多的.这个现象就非常有意思了.

2.4 按州统计

c_itcont.groupby('STATE').sum().sort_values('TRANSACTION_AMT',ascending=False)

image-20210304210750836

可以发现CA即加州的捐款最多.

3. 数据可视化

3.1 按州统计

import matplotlib.pyplot as plt
%matplotlib inline
from wordcloud import WordCloud,ImageColorGenerator
st_amt = c_itcont.groupby('STATE').sum().sort_values("TRANSACTION_AMT",ascending=False)[:10]
st_amt=pd.DataFrame(st_amt, columns=['TRANSACTION_AMT'])
st_amt.plot(kind='bar')
image-20210304211621683

3.2 支持拜登的人员分布

# 从所有数据中取出支持拜登的数据
biden = c_itcont[c_itcont['CAND_NAME']=='BIDEN, JOSEPH R JR']
# 统计各州对拜登的捐款总数
biden_state = biden.groupby('STATE').sum().sort_values("TRANSACTION_AMT", ascending=False).head(10)
# 饼图可视化各州捐款数据占比
biden_state.plot.pie(figsize=(10, 10),autopct='%0.2f%%',subplots=True)
image-20210304211900552

4. 词云

wc = WordCloud(# FFFAE3
    background_color="white",  # 设置背景为白色,默认为黑色
    width=890,  # 设置图片的宽度
    height=600,  # 设置图片的高度
    mask=bg,    # 画布
    margin=10,  # 设置图片的边缘
    max_font_size=100,  # 显示的最大的字体大小
    random_state=20,  # 为每个单词返回一个PIL颜色
).generate_from_text(data)

# 图片背景
bg_color = ImageColorGenerator(bg)
plt.imshow(wc.recolor(color_func=bg_color))
plt.axis("off")
wc.to_file("datasets/pandas_president/biden_wordcloud.png")
image-20210305081937127
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

古承风

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值