pyscuba代表“python for single cell clustering using bi叉
分析”。
pyscuba是一种新的提取谱系的计算方法
单细胞基因组学数据的关系和动力学建模
与细胞分化相关的变化。皮斯库巴从
非线性动力学技术与随机知识
微分方程为建模提供了系统框架
涉及多沿袭规范的复杂过程。
该方法有一个matlab实现。然而,皮斯库巴是
彻底检修和重新设计,其中一些错误,数学
已采取不一致和异常情况处理不当的措施
关心。pyscuba还附带了一个gui,使用python包装器编写
对于qt框架。
pyscuba是开源的,可以使用而无需支付高昂的许可费
这妨碍了我们的一些同事。此外,皮斯库巴是
处理计算和数据的速度更快、效率更高的方法
相应计算生物学方法的基础处理。打开
比较基准,发现在Matlab代码中
大约20分钟后完成,Pyscuba在大约30分钟内完成相同的任务
几秒钟。
安装
pyscuba是用python 2.7编写的。它依赖于以下库
和API:*^{TT1}$(1.4.3或其他版本)*^{TT2}$
(1.9.0或更高版本)*Pillow(3.2.0或更高版本)*PyQt4(至少
版本4.11.4)*python-igraph(版本>;=0.7.1)*rpy2(2.8.1
或更高版本)*scipy(0.17.0或更高版本)*setuptools
(版本>;=21.0.0)*sklearn(版本>;=0.17.1)*Wand(版本
0.4.3或后续)
大多数依赖项都应该在
使用pip安装,方法是*启动终端;*运行
$ pip install PySCUBA。
尽管如此,请确保以前满足了所有这些先决条件
继续。尤其是,PyQt可能必须
手动安装。另外,请注意,您可能需要运行
根据您的python安装使用sudo。
或者,您也可以通过下载
来自相应github页面的tarball或zip存档。一旦你有了
下载并解压源,导航到根源
目录并运行:
$ python setup.py install
用法
在终端中,运行
$ PySCUBA
一个图形用户界面应该弹出。
选择要处理的文件并选择相关的数据类型和其他
这些参数。对这些选项的详细解释可以是
通过将光标保持在一个特定的按钮上获得;这个
包括数据集的格式规范。
在您的数据经过
GAP统计与惩罚极大似然估计
福克-普朗克势的参数,将提示您选择
在pyscuba gui中显示的各种输出文件。你可以滚动
向上和向下显示窗口,以及放大和缩小。
示例
一个完整的、带注释的示例,演示了标准用法
皮斯库巴就在这里。
首先,在python会话中,让我们导入几个模块。
Pandas将非常方便地获取示例数据集:from os import getcwd, path
import pandas as pd
所讨论的数据集是来自Deng等人的一些QPCR数据,“单细胞
rna-seq揭示哺乳动物动态随机单等位基因表达
细胞。“科学。2014年1月10日;343(6167):193-6。它可以从
特定的github存储库,其url显示在下面。我们想要
该文件的内容,而不是其完整的github视图,这就是为什么我们使用
Raw链接到该存储库并解释缺少任何blob/
在其url路径中:url = 'https://raw.githubusercontent.com/gcyuan/SCUBA/master/sample_data/guo2010/guo2010Data.txt'
df = pd.read_csv(url, delimiter='\t')
通过键入来检查是否没有发生任何异常情况df.head()
我们现在要把这个数据框写到一个tab-sepaated*.txt文件
在当前工作目录中:df.to_csv(path.join(getcwd(), 'super_duper_data.txt'), sep='\t', index=False)
在您的终端中,我们现在准备启动pyscuba图形用户
接口,可以从任何目录启动(不一定是
一个持有super_duper_data.txt):$ PySCUBA
请参阅pyscuba的github页面,以获取屏幕截图,说明pyscuba gui在开始时的外观,如何选择super_duper_data.txt进行处理,以及,
一旦尘埃落定,如何选择要显示的文件
调查。
归因
如果你觉得派斯库巴对你的研究有用,请引用它的github
存储库:
相应的bibtex条目是@misc{Giecold2016,
author = {Giecold, G.},
title = {PySCUBA},
year = {2016},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/GGiecold/PySCUBA}},
commit = {8ee6a08de15decdcdaf7d877888ae783832d80f2}
}
此外,请同时引用以下参考资料:
马可E,卡尔R,郭G,罗布森P,哈特A,特里帕L,袁GC。(2014年)
单细胞基因表达数据的分岔分析揭示
后生景观”。国家科学院学报,
111,E5643-E5650。
许可证
版权所有2016-2021 Gregory Giecold。
Pyscuba是麻省理工学院许可下提供的免费软件。为了
详细信息请参见许可文件。
欢迎加入QQ群-->: 979659372
推荐PyPI第三方库