在练习apriori算法时出现的错误,用此文章大佬所给的数据集时没有报错,而用自己的数据集时报错了。没有查到这个报错的其他博客。
错误的原因是没有保证项集中的每一笔交易是均为一个集合,即里面的元素不能重复。我们是在计算对唐诗分词后的数据集进行apriori时遇到了这个错误,故一定出现了某首唐诗,它分词后同一个字或词在一个item里出现了多次。
即时消费者的购物车里有“糖×2,可乐×3,米”,我们在写一个item时也应该记为“糖,可乐,米”。
在练习apriori算法时出现的错误,用此文章大佬所给的数据集时没有报错,而用自己的数据集时报错了。没有查到这个报错的其他博客。
错误的原因是没有保证项集中的每一笔交易是均为一个集合,即里面的元素不能重复。我们是在计算对唐诗分词后的数据集进行apriori时遇到了这个错误,故一定出现了某首唐诗,它分词后同一个字或词在一个item里出现了多次。
即时消费者的购物车里有“糖×2,可乐×3,米”,我们在写一个item时也应该记为“糖,可乐,米”。