pandas 替换问题

最新推荐文章于 2024-03-27 18:48:45 发布

得不到秘方的痞老板

最新推荐文章于 2024-03-27 18:48:45 发布

阅读量73

点赞数

文章标签： python 机器学习开发语言

本文链接：https://blog.csdn.net/weixin_41158461/article/details/125144037

版权

import pandas as pd
import numpy as np

df_brand = pd.DataFrame(pd.read_excel('brand.xlsx'))
df_link = pd.DataFrame(pd.read_excel('product.xlsx'))
df_new =pd.DataFrame()

# data=np.random.randn(6,4)#创建一个6行4列的数组
# df=pd.DataFrame(data,columns=list('ABCD'),index=[1,2,'a','b','2006-10-1','第六行'])
#提取含有指定字符的行
 #regex=True则pat是一个正则表达式，regex=False表示pat是一个字符串
# print(len(df_link))
# print(len(df_link))
for i in range(1,len(df_brand)):
    brand = (df_brand.iloc[[i],[0]].values[0][0]) # 取值
    i=len(df_link)
    df2 = df_link.drop(df_link[df_link['商品名'].str.contains(pat='%s'%brand, regex=False, case=True)].index,
                       inplace=True)  # regex=True则pat是一个正则表达式，regex=False表示pat是一个字符串
    j=len(df_link)
    if i-j !=0:
        print(brand) #删的什么品牌词
print(len(df_link))
# print(df_link['商品名'],df_link['产品地址'])
df_new = df_link
print(len(df_new))
df_new.to_excel("product_new.xlsx")