数据分析项目实战day2

目录

1.人口数据分析

1.导入并查看相关文件信息

2.进行数据操作

2.政治献金数据分析

1.读取数据查看相关信息

2.进行数据操作

3.用户消费数据分析

1.数据预处理

2.按月进行分析

​ 3.用户个体消费分析


​​​​​​​


1.人口数据分析

1.导入并查看相关文件信息

state表示州的全称,abbreviation表示缩写。

state表示州 areas表示所占面积。

state表示州,age表示调查人口的年龄,year表示统计年份,population表示人口数量。 

2.进行数据操作

将人口数据和各州简称数据合并。

上图中有两列缩写,删除其中一列。

将state空值对应的简称找到

 对简称进行去重

给为空的state补上正确的值,从而去除nan。

利用之前判别是否存在nan检测操作是否成功。

将面积数据进行合并

 删除面积为nan对应的行。

找出2010年全部年龄人口数据

 计算各州人口密度,排序并找出人口密度最高

 完整代码如下:

import numpy as np
import pandas as pd
from pandas.core.indexes.base import Index

abb=pd.read_csv("state-abbrevs.csv")#state表示州全称 abbreviation表示缩写
#print(abb)
area=pd.read_csv("state-areas.csv")#state表示州 areas表示所占面积
#print(area)
pop=pd.read_csv("state-population.csv")#state表示州,age表示调查人口的年龄,year表示统计年份,population表示人口数量。 
#print(pop)
#将人口数据和各州简称数据合并
abb_pop=pd.merge(abb,pop,left_on='abbreviation',right_on='state/region',how='outer')
# print(abb_pop.head(5))
a
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值