需求
加载数据
查看数据的基本信息
指定数据截取,将如下字段的数据进行提取,其他数据舍弃
cand_nm: 候选人姓名
contbr_nm:捐赠人所在州
contbr_employer:捐赠人所在公司
contbr_occupation:捐赠人职业
contbr_receipt_amt:捐赠数额(美元)
contbr_receipt_dt:捐款的日期
对新数据进行总览,查看是否存在缺失数据
用统计学指标快速描述数值型属性的概要。
空值处理。可能因为忘记填写或者保密等等原因,相关字段出现了空值,将其填充为NOT PROVIDE
异常值处理。将捐款金额<=0的数据删除
新建一列为各个候选人所在党派party
查看party这一列中有哪些不同的元素
统计party列中各个元素出现次数
查看各个党派收到的政治献金总数contb_receipt_amt
查看具体每天各个党派收到的政治献金总contb_receipt_amt
将表中日期格式转换为'yyyy-mm-dd'。
查看老兵(捐献者职业)DISABLED VETERAN主要支持谁
import numpy as np
import pandas as pd
df = pd.read_csv("./data/usa_election-Copy1.txt")
# 方便操作,将月份和参选人以及所在政党进行定义:
months = {'JAN':1, 'FEB':2, 'MAR':3, &#