python求解距离矩阵_python – 从距离矩阵计算亲和度矩阵

我使用clustal欧米茄获得500个蛋白质序列的距离矩阵(它们彼此同源).

我想使用亲和传播来聚类这些序列.

最初,因为我手工观察到距离矩阵只有0到1之间的值,0距离= 100%同一性,我推断我可以采取(1 – 距离)来获得亲和力.

我运行了我的代码,集群看起来很合理,我认为一切都很好……直到我读到这一点,通常通过应用“热内核”从距离矩阵计算亲和度矩阵.那就是我脑海里一切都崩溃的时候.

我是否认为亲和矩阵的概念不正确?有没有简单的方法来计算亲和度矩阵? scikit-learn提供以下公式:

similarity = np.exp(-beta * distance / distance.std())

但什么是beta?我知道distance.std()是距离的标准偏差.

我现在对所涉及的概念感到困惑和迷失(而不是实际的编码实现),所以非常感谢任何帮助!

附:我已经尝试过发布到Biostars.org,但我还没有得到答案……

解决方法:

我认为1距离和exp(-beta *距离)都是将距离转换为相似性的有效方法(尽管它们在概率框架中的解释不同).我会简单地使用什么给出更好的结果.

标签:python,bioinformatics,affinity

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值