import pandas as pd import numpy as np df_brand = pd.DataFrame(pd.read_excel('brand.xlsx')) df_link = pd.DataFrame(pd.read_excel('product.xlsx')) df_new =pd.DataFrame() # data=np.random.randn(6,4)#创建一个6行4列的数组 # df=pd.DataFrame(data,columns=list('ABCD'),index=[1,2,'a','b','2006-10-1','第六行']) #提取含有指定字符的行 #regex=True则pat是一个正则表达式,regex=False表示pat是一个字符串 # print(len(df_link)) # print(len(df_link)) for i in range(1,len(df_brand)): brand = (df_brand.iloc[[i],[0]].values[0][0]) # 取值 i=len(df_link) df2 = df_link.drop(df_link[df_link['商品名'].str.contains(pat='%s'%brand, regex=False, case=True)].index, inplace=True) # regex=True则pat是一个正则表达式,regex=False表示pat是一个字符串 j=len(df_link) if i-j !=0: print(brand) #删的什么品牌词 print(len(df_link)) # print(df_link['商品名'],df_link['产品地址']) df_new = df_link print(len(df_new)) df_new.to_excel("product_new.xlsx")
pandas 替换问题
最新推荐文章于 2024-03-27 18:48:45 发布