pandas使用duplicated函数删除dataframe中重复列名称的数据列、默认保留重复数据列中的第一个数据列(removing duplicate columns in dataframe)
目录
pandas使用duplicated函数删除dataframe中重复列名称的数据列、默认保留重复数据列中的第一个数据列(removing duplicate columns in dataframe)
#pandas使用rename函数重命名dataframe中数据列的名称、从而创建一个包含重复列名称的dataframe数据集
#仿真数据
import pandas as pd
import numpy as np
# 不显示关于在切片副本上设置值的警告
pd.options.mode.chained_assignment = None
# 一个 dataframe 最多显示60例
pd.set_option('display.max_columns', 100)
# 可视化工具包
import matplotlib.pyplot as plt
%matplotlib inline
#设置默认字体大小
plt.rcParams['font.size'] = 16
data = {'产品':['肉类','盐铁','纺织','木材']*2,