python统计excel利用pandans的分组

博客讲述了如何使用Python的pandas库对包含日期统计的三个CSV文件进行数据处理,重点是删除非必需列,找出三文件按area_id的type和bdtype的交集,并进行三次分组统计,以确定缺失的数据项。
摘要由CSDN通过智能技术生成

python统计excel利用pandans的分组,其中还用列表数据求差集

csv数据结构(有三个按照日期统计的csv)

在这里插入图片描述

需要统计出这三张csv按照areaid缺少的type和bdtype

其中type=[1,2,3,4] bdtype=[1,3,4]

源码如下:

第一步数据初步处理删除非必须列
# -*- coding: utf-8 -*-
import requests
import pandas as pd
import numpy as np
import re
"""数据读取,初步处理删除不要的列"""
cname = ['num','area_id','type','bd_type','date']
dftfour = pd.read_csv("20191224.csv")
dftthree = pd.read_csv("20191223.csv")
dfttwo = pd.read_csv("20191222.csv")

dftfour.columns = cname
dftthree.columns = cname
dfttwo.columns = cname
dftfour = dftfour.drop(['num','date'], axis=1)
dftthree = dftthree.drop(['num','date'], axis=1)
dfttwo = dfttwo.drop(['num','date']</
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值