哈希树的简单实现(A simple implementation of Hash Tree)

# coding=utf-8

"""
A simple implementation of Hash Tree
哈希树的简单实现
"""
from functools import reduce


class HashTreeNode(object):
    def __init__(self, name=''):
        self.val = 0
        self.name = name
        self.level = 0
        self.children = {}

    def addBag(self, bag):
        """
        Note that bag must be sorted
        """
        if bag:
            node = self.children.get(bag[0], HashTreeNode(name=bag[0]))
            node.addBag(bag[1:])
            self.children[bag[0]] = node
            self.level = len(bag)

    def count(self, transaction):
        """
        count the child who matches bag, suppose that current node matches
        """
        if self.level == 0:
            self.val += 1
        elif self.level == 1:
            for t in transaction:
                if t in self.children: self.children[t].val += 1
        else:
            for i in range(0, len(transaction)):
                t = transaction[i]
                if t in self.children:
                    self.children[t].count(transaction[i:])

    def get(self, theta):
        """
        if self.level == 0:
            return [[self.name]] if self.val >= theta else None
        else:
            children_res = [self.children[i].get(theta) for i in sorted(self.children.keys())]
            total = reduce(lambda res, x: res + x, filter(lambda x: x, children_res), [])
            return map(lambda c: [self.name] + c, total)
        """
        return [[c.name for c in items] for items in self.getNodes(theta)]

    def getNodes(self, theta):
        if self.level == 0:
            return [[self]] if self.val >= theta else None
        else:
            children_res = [self.children[i].getNodes(theta) for i in sorted(self.children.keys())]
            total = reduce(lambda res, x: res + x, [x for x in children_res if x], [])
            return [[self] + c for c in total]

    def __str__(self):
        return '(%s : %s)' % (self.name, '; '.join([str(i) for i in list(self.children.values())]))


def sameNode(node1, node2):
    return node1.name == node2.name


def sameNodes(nodes1, nodes2):
    func = lambda n: n.name
    return list(map(func, nodes1)) == list(map(func, nodes2))


class HashTree(object):
    """
    Note that all bags must be sorted
    """

    def __init__(self, bags):
        self.root = HashTreeNode()
        self.root.val = 0
        for b in bags:
            if b: self.root.addBag(b)

    def count(self, transactions):
        for t in transactions: self.root.count(t)

    def get(self, theta):
        res = [c[1:] for c in self.root.get(theta)]
        return [] if res == [[]] else res

    def getNodes(self, theta):
        res = [c[1:] for c in self.root.getNodes(theta)]
        return [] if res == [[]] else res

    def __str__(self):
        return str(self.root)


if __name__ == '__main__':
    to_count = [[1, 2], [2, 4], [1, 3], [1, 5], [3, 4], [2, 7], [6, 8]]
    tree = HashTree(to_count)
    transactions = [[1, 2, 3], [1, 2, 4], [2, 4, 6, 8], [1, 3, 5, 7]]
    tree.count(transactions)
    print('Frequency with transactions', transactions)
    print(tree.get(2))
    print(tree.get(1))

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
“Counting Supports of Candidates Using Hash Tree”是一种利用哈希来计算候选项集支持度的方法。以下是一个简单的例子,说明如何使用哈希来计算候选项集的支持度。 假设我们有一个包含以下事务的数据集: ``` t1: {1, 2, 3, 4} t2: {1, 2, 4, 5} t3: {2, 4, 5} t4: {1, 2, 3, 4, 5} ``` 我们要计算每个2项集的支持度。首先,我们需要生成所有的2项集: ``` {1, 2} {1, 3} {1, 4} {1, 5} {2, 3} {2, 4} {2, 5} {3, 4} {3, 5} {4, 5} ``` 接下来,我们可以使用哈希来计算每个2项集的支持度。首先,对于每个项集,我们将其插入到哈希中。具体地,从根节点开始,对于每个项集中的元素,根据哈希函数计算其子节点的位置,并将项集插入到相应的节点中。例如,对于项集{1, 2},我们需要依次插入到根节点、子节点1和子节点2中。最终,我们得到以下哈希: ``` {} / | | \ 1 2 3 4 /| | | \ 2 3 4 5 5 / | | | 3 4 5 4 ``` 在计算支持度时,我们只需要遍历哈希的叶子节点,找到包含在每个事务中的项集,并增加其计数器的值。例如,当处理事务t1时,我们需要遍历项集{1, 2}、{1, 3}、{1, 4}和{2, 3},并增加其计数器的值。最终,我们得到每个2项集的支持度: ``` {1, 2}: 3 {1, 3}: 1 {1, 4}: 2 {1, 5}: 1 {2, 3}: 2 {2, 4}: 3 {2, 5}: 2 {3, 4}: 2 {3, 5}: 2 {4, 5}: 2 ``` 这就是使用哈希来计算候选项集支持度的简单示例。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值