阿里云天池task4

这篇博客介绍了如何进行2020美国选举数据分析项目。通过合并候选人信息和捐款档案数据,进行了数据清洗和探索,分析了候选人党派和不同职业、州别的捐款数额。此外,还利用数据可视化工具揭示了数据背后的趋势。博客强调了Python在数据处理和分析中的应用,并表达了作者对使用Python进行数据分析的积极态度。
摘要由CSDN通过智能技术生成

数据分析
首先task4是一个项目做一个数据分析的题目是关于2020美国选举的。

数据集
所有候选人信息

CAND_ID 候选人ID
CAND_NAME 候选人姓名
CAND_PTY_AFFILIATION 候选人党派
候选人委员会链接信息
CAND_ID 候选人ID
CAND_ELECTION_YR 候选人选举年份
CMTE_ID 委员会ID
个人捐款档案信息
CMTE_ID 委员会ID
NAME 捐款人姓名
CITY 捐款人所在市
State 捐款人所在州
EMPLOYER 捐款人雇主/公司
OCCUPATION 捐款人职业
数据处理
将数据进行对应,通过ID关联两张表,这里引入了数据库的概念。将关联的数据转化为表。

数据探索与清洗
进过数据处理部分,我们获得了可用的数据集,现在我们可以利用调用shape属性查看数据的规模,调用info函数查看数据信息,调用describe函数查看数据分布。

数据分析
将捐款额进行了三次分析一个是候选人的另一个是不同职业的,不同洲的捐款数额可以看出不同人不同党派的收入和不同职业收入来进一步探索数据的奥妙

数据可视化
可以将数据图形化很智能的一个功能

总结
整体看下来task4为我们介绍了怎么去分析做表,做图形等直观的让我们看到从数据面上两位候选人谁更容易竞选总统,可以看出python的智能和功能强大。这次学习更多的收获了怎么去使用python,怎么调用数据。以后会更多尝试使用python来分析各种数据,感谢阿里云有这么好的资源学习。
 
————————————————
版权声明:本文为CSDN博主「book思议119」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_64756514/article/details/123520380

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值