使用python数据清洗
第一步:
安装pandas模块
pip install pandas
第二步:
导入pandas模块
import pandas as pd
第三步:
读取excel表格
df = pd.read_excel("data.xlsx")
第四步:
删除重复项
df1 = df.drop_duplicates()
第五步:
对缺失值进行填充 ,用实数0填充NAN
df2 = df1.fillna(value=0)
print(df2)
统计数量
area = df.loc[:, 'district'].value_counts() # 每个地区数量
print(area)