Python pandas 按特征对物料循环分类

Python pandas 按特征对物料循环分类

原始数据
输出结果

在这里插入代码片#最终版

import pandas as pd 
import numpy as np


#导入原始数据
file_name='/Users/tianqing/Desktop/python/按特征归类.xlsx'
data=pd.read_excel(file_name)
data_name=data['物料'].drop_duplicates().tolist()

class_total={} #建一个大的类别字典

class_1={'name':[],'ch':[]}
data_name[0]
class_1['name'].append(data_name[0])
class_1['ch'].extend(data[data['物料']==data_name[0]]['特征'].tolist())

class_total['class_1']=class_1#现将第0个物料放在类别1


n=1
for i in data_name: ##i是物料,从物料开始循环,判断是否属于同一类
    b=data[data['物料']==i]['特征'].tolist()
    class_df = pd.DataFrame.from_dict(class_total,orient='index')
    for j in class_df.index: ##j是class_1,类别名/dataframe index
        a=class_df.loc[j]['ch'] ##a是特征,列表形式
        x=[k for k in a if k in b]
        if x!=[]:#如果有相同的特征,则加入该字典
            s=class_df.loc[j].to_dict()
            s['name'].append(i)
            s['ch'].extend(data[data['物料']==i]['特征'].tolist())
            class_total[j]=s
            break
    else:
        s={'name':[],'ch':[]}
        s['name'].append(i)
        s['ch'].extend(data[data['物料']==i]['特征'].tolist())
        n +=1
        class_total['class_'+str(n)]=s
    
data_name
class_df

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值