python统计excel利用pandans的分组,其中还用列表数据求差集
csv数据结构(有三个按照日期统计的csv)
需要统计出这三张csv按照areaid缺少的type和bdtype
其中type=[1,2,3,4] bdtype=[1,3,4]
源码如下:
第一步数据初步处理删除非必须列
# -*- coding: utf-8 -*-
import requests
import pandas as pd
import numpy as np
import re
"""数据读取,初步处理删除不要的列"""
cname = ['num','area_id','type','bd_type','date']
dftfour = pd.read_csv("20191224.csv")
dftthree = pd.read_csv("20191223.csv")
dfttwo = pd.read_csv("20191222.csv")
dftfour.columns = cname
dftthree.columns = cname
dfttwo.columns = cname
dftfour = dftfour.drop(['num','date'], axis=1)
dftthree = dftthree.drop(['num','date'], axis=1)
dfttwo = dfttwo.drop(['num','date']</