Python task4 学习笔记

本笔记为阿里云天池龙珠计划python训练营的学习内容,链接为:https://tianchi.aliyun.com/specials/promotion/aicampsql

步骤:
导入包 -> 读入表1与表2(pd.read_csv) -> 关联两表(pd.merge,类似sql中join)为12 -> 提取12中需要的列(pd.DataFrame)
-> 查看前几行(数据框.head) -> 读入捐赠人 -> 合并表3 -> 提取最后需要的列 -> 查看数据规模(.shape) -> 查看整体数据信息(.info)
-> 空值处理(.fillna) -> 处理日期列(astype(str)) -> 再次查看数据信息 -> 查看数值类型的列TRANSACTION_AMT分布情况(.describe) 
-> 查看单列数据分布情况([列名].describe) -> 计算每个党派获得的捐款总额,排序取前十位(groupby('CAND_PTY_AFFILIATION').sum().sort_values())
-> 计算每个候选人获得捐款总额,排序取前十 -> 不同职业捐款总额,排序取前十 -> 查看每个职业捐款人的数量(.value_counts()) 
-> 每个州获得总额,排序取前五 -> 每个州捐款人数量 -> 查看各州职业分布 -> 提取6个高端职业研究分布 
-> 导入可视化包及词云库 -> 按州总捐款数和总捐款人数柱状图(.plot(kind = 'bar')) -> 总捐款人数柱状图(.size())
-> 热门候选人拜登在各州的获得的捐赠占比 -> 选出支持拜登的数据 -> 统计各州对拜登的捐款总数
-> 饼图可视化(.plot.pie) -> 总捐最多的候选人捐赠者词云图 -> 图片图像和北京颜色分离,并纯色填充
-> 下载处理后的图片(!wget) -> 图片文件名重命名(os.rename()) -> 将所有捐赠者姓名连成字符串
-> 读取图片文件(plt.imread) -> 生成(WordCloud().generate_from_text(data))
-> 开始画图(plt.imshow(wc.recolor(color_func=ImageColorGenerator(plt.imread("biden.jpg")))))
-> 为云图去掉坐标轴(plt.axis("off")) -> 保存云图(wc.to_file("biden_wordcloud.png"))

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值