python列表嵌套

最近在做分层聚类,聚类结果可以通过scipy的分层聚类包得到。分层聚类的思想就是不断融合两个“距离最近”的簇,直到不满足用户划定的融合阈值为止。这样,最终将得到一棵二叉树。每个叶子结点对应到原始数据集中的每个观测点。每个簇中的簇我是知道的,但是内部的组织关系不知道。我要做的就是对每个簇的二叉子树的组织结构进行描述。聚类的结果为各个簇的元素,而且各个簇的父节点也可以得到。我现在要把每个簇的聚类过程描述出来。现在得到了很多这样的嵌套列表:

l = [1, [3, [5, [9, 10]]]]

现在,要得到自内向外的合并顺序。

这个例子中,我要得到的最终结果为:

l = [[9, 10], [5, 9, 10], [3, 5, 9, 10], [1, 3, 5, 9, 10]]

对应到分层聚类问题就是:

[9,10]聚成一类,然后再和5聚成一类,再和3聚成一类,最后和1聚成一类。

这样一来,簇内的各个节点的层次关系就显而易见了。可以将其输出成文本形式,能够作为相似性强弱的参考依据。

这里附上例子的源代码:

from collections import Iterable

a = []
def flatten(items, ignore_types=(str, bytes)):
    for x in items:

        if isinstance(x, Iterable) and not isinstance(x, ignore_types):
            b = []
            for item in flatten(x):
                yield item
                b.append(item)
            a.append(b)
        else:
            yield x


items = [1, [3, [5, [9, 10]]]]
c = []
for x in flatten(items):
    c.append(x)
a.append(c)
print a
借鉴了python cookbook中的扁平化处理嵌套型序列的方法。

这只是项目中碰到的若干小问题中的一个,不过它在簇内层次关系的抽取上起到了不小的作用。




  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值