测试的数据,投资理财项目的数据是需要合并,想了好久没有好的办法,最好想到用数据分析神奇 pandas
之前我们测试数据清洗的时候,有些数据是重复的,如果一条拉取去测,一定是错误的,需要把重复的项目进行合并,然后再读取excel
思路是:
先判断这一列是否有这一项, 如果有显示True ,然后 把这一列的值替换,然后去重, 可以根据行名取投资理财的数据 例如 :
dataframe=dataframe.loc[dataframe[“项目”].isin( [‘投资理财’])]
参考代码
import numpy
import pandas as pd
dataframe=pd.read_excel("dataproject.xlsx")
dataframe=dataframe.loc[dataframe["项目"].isin( ['投资理财'])]
print(dataframe)
copy=dataframe.copy()
if numpy.any (dataframe.copy().学习平台=="学习平台、题库"):
dataframe.学习平台="学习平台、题库"
if numpy.any (dataframe.copy().教务=="教务"):
dataframe.教务="教务"
if numpy.any (dataframe.copy().官网=="官网+app展示"):
dataframe.官网="官网+app展示"
print(dataframe.drop_duplicates())