在生信开发过程中,会大量使用Python脚本,除了多进程和多线程编程提高程序运行效率外,还可以借助效率更高的Python解释器来提高程序的运行速度, CPython 使用c语言实现的解释器, PyPy 使用python语言的子集RPython实现的解释器,一般情况下PyPy比CPython快4倍左右。
1. 比较解释器的运行效率
# task.py
import time
def compute_task():
"""计算平方和"""
total = 0
for i in range(1, 10000000):
total += i ** 2
return total
def time_execution(func):
start_time = time.time()
func()
end_time = time.time()
return end_time - start_time
if __name__ == "__main__":
execution_time = time_execution(compute_task)
print(f"Execution time: {execution_time:.4f} seconds")
2种不同解释器运行程序消耗时间:
使用pypy3运行相同程序,运行消耗时间约为CPython消耗时间的1/16。
python task.py
# Execution time: 2.5991 seconds
pyp3 task.py
# Execution time: 0.1562 seconds
2. conda 安装pypy
conda-forge通道支持使用PyPy解释器创建和安装包到环境中, conda安装目前仅支持的Python版本是3.8和3.9。
# 创建环境
conda create -c conda-forge -n pypy3.9 pypy python=3.9
# 激活环境
conda activate pypy3.9
# 使用严格的通道优先级
conda config --set channel_priority strict
3. pypy下载安装
# linux 64 python3.10版本下载
wget https://downloads.python.org/pypy/pypy3.10-v7.3.17-linux64.tar.bz2
tar -xvjf pypy3.10-v7.3.17-linux64.tar.bz2
# linux 64 python3.9版本下载
wget https://downloads.python.org/pypy/pypy3.9-v7.3.10-linux64.tar.bz2
tar -xvjf pypy3.9-v7.3.10-linux64.tar.bz2
windows版本:
python3.10 : https://downloads.python.org/pypy/pypy3.10-v7.3.17-win64.zip
python3.9 : https://downloads.python.org/pypy/pypy3.9-v7.3.16-win64.zip
3.1 基于python 3.10和python 2.7的pypy安装
下载地址: https://pypy.org/download.html
3.2 python 其他版本安装pypy
下载地址: https://downloads.python.org/pypy/
生信软件文章推荐
生信软件1 - 测序下机文件比对结果可视化工具 visNano
生信软件3 - mapping比对bam文件质量评估工具 qualimap
生信软件4 - 拷贝数变异CNV分析软件 WisecondorX
生信软件7 - 多线程并行运行Linux效率工具Parallel
生信软件8 - bedtools进行窗口划分、窗口GC含量、窗口测序深度和窗口SNP统计
生信软件9 - 多公共数据库数据下载软件Kingfisher
生信软件10 - DNA/RNA/蛋白多序列比对图R包ggmsa
生信软件11 - 基于ACMG的CNV注释工具ClassifyCNV
生信软件12 - 基于Symbol和ENTREZID查询基因注释的R包(easyConvert )
生信软件13 - 基于sambamba 窗口reads计数和平均覆盖度统计
生信软件14 - bcftools提取和注释VCF文件关键信息
生信软件15 - 生信NGS数据分析强大的工具集ngs-bits
生信软件17 - 基于fasta文件的捕获探针设计工具catch
生信软件18 - 基于docker部署Web版 Visual Studio Code
生信软件20 - seqkit+awk+sed+grep高级用法技巧合辑
生信软件21 - 多线程拆分NCBI-SRA文件工具pfastq-dump
生信软件22 - 测序数据5‘和3‘端reads修剪工具sickle
生信软件23 - Samtools和GATK去除PCR重复方法汇总
生信软件24 - 查询物种分类学信息和下载基因组TaxonKit和ncbi-genome-download
生信软件26 - BWA-MEM比对算法性能更好的bwa-mem2
生信软件27 - 基于python的基因注释数据查询/检索库mygene
生信软件28 - fastq与bam的reads数量计算与双端fastq配对检测工具fastq-pair
生信软件29 - 三代数据高效映射精确的长读段比对工具mapquik