python 数据编码器_在数据上应用事务编码器

该博客介绍了如何使用mlxtend库中的TransactionEncoder对数据进行事务编码。通过示例展示了将原始数据转换成适用于机器学习模型的编码数据集的过程,并提供了从数据帧到编码数据的完整代码。
摘要由CSDN通过智能技术生成

你可以试试这个:import pandas as pd

import numpy as np

from io import StringIO

from mlxtend.preprocessing import TransactionEncoder

inputstr = StringIO("""0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

30 31 32

33 34 35

36 37 38 39 40 41 42 43 44 45 46

38 39 47 48

38 39 48 49 50 51 52 53 54 55 56 57 58

32 41 59 60 61 62

3 39 48 """)

df = pd.read_csv(inputstr, header=None,sep='\s+')

df_out = df.apply(lambda x: list(x.dropna().values), axis=1).tolist()

transactionEncoder = TransactionEncoder()

dataset = transactionEncoder.fit(df_out).transform(df_out)

dataset = dataset.astype('int')

print(dataset)

输出:

^{pr2}$

并转换为数据帧:dataset_df = pd.DataFrame(dataset)

输出:0 1 2 3 4 5 6 7 8 9 ... 53 54 55 56 57 58 59

0 1 1 1 1 1 1 1 1 1 1 ... 0 0 0 0 0 0 0

1 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0

2 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0

3 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0

4 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0

5 0 0 0 0 0 0 0 0 0 0 ... 1 1 1 1 1 1 0

6 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 1

7 0 0 0 1 0 0 0 0 0 0 ... 0 0 0 0 0 0 0

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值