qq_27390023-CSDN博客

原创 Bioconda 介绍

Bioconda是一个基于Conda的生物信息学开源软件包管理平台，专为解决生物信息工具的安装、版本控制和环境隔离问题而设计。其核心特点包括：专注生物信息学工具（覆盖基因组学、转录组学等领域10000+工具）；基于Conda的环境隔离机制，可自动处理复杂依赖链；跨平台兼容Linux/macOS；与Snakemake等流程工具无缝衔接。安装需先配置Miniconda并添加Bioconda仓库源，支持创建独立环境、安装指定版本工具及导出环境配置。虽然存在部分工具更新滞后和Windows支持有限等局限性，但Bio

2026-01-22 20:44:42 305

原创 nf-core介绍

nf-core是一个基于Nextflow的开源生物信息学分析流程社区项目，提供标准化、可复现的分析工作流。其核心特点包括：即插即用（自带测试数据和容器镜像）、社区共建（GitHub公开协作）和跨平台支持（适配本地/HPC/云环境）。官网提供流程检索、文档查询和社区交流功能。主要工具包括nf-core命令行工具和Nextflow运行时，支持流程检索、创建、测试和更新。典型流程涵盖转录组、变异检测、单细胞等分析，所有流程遵循严格的开发规范，包括语法模板、依赖管理、测试验证等要求。项目通过Slack社区提供技术支

2026-01-22 20:40:06 307

原创工作流管理工具Nextflow 和 Snakemake介绍

Nextflow和Snakemake是两大生物信息学工作流管理工具，各有优势。Nextflow基于Groovy/DSL2，擅长大规模数据处理，支持云平台和强容错机制，适合分布式计算场景。Snakemake采用纯Python语法，规则驱动，环境管理灵活，更适合中小型流程和Python开发者。两者均支持容器化，解决科研计算的可复现性问题。选择依据：Python背景/轻量流程选Snakemake；大规模/分布式需求选Nextflow。

2026-01-22 20:31:48 369

原创 Singularity介绍、安装和使用

Singularity（现名Apptainer）是一款专为HPC和科研设计的容器工具，相比Docker具有安全优势：非root运行、支持HPC硬件（GPU/MPI）、单文件镜像格式。安装需Linux系统，通过Go语言编译，包含依赖包安装、源码编译等步骤。基础使用包括镜像拉取（支持Docker镜像转换）、容器运行（shell/exec/run模式）、目录挂载和自定义镜像构建。特别适合集群环境，支持GPU任务（--nv参数）和SLURM作业提交。其核心特点是安全、HPC友好和镜像便携性，是科研计算场景的理想容器

2026-01-22 20:28:18 510

原创 Docker 介绍、安装与使用

Docker = 轻量虚拟机 + 软件安装包 + 运行环境三合一；安装→ 添加官方源 →→ 启动服务；使用→pull镜像 →run容器 → 挂载目录即可分析 NGS 数据。装好 Docker 后，你就可以直接docker run任何生物信息工具镜像，告别繁琐依赖安装！

2026-01-22 20:19:41 452

原创 Docker 与 Singularity 镜像实战指南

Docker：适合个人开发、本地调试、构建新工具。：适合大规模生信数据分析、在 HPC/超算上运行。核心建议永远在镜像名和文件名中保留版本号。

2026-01-22 19:38:17 523

原创项目骨架生成工具Cookiecutter介绍

Cookiecutter是一款便捷的项目骨架生成工具，通过模板化方式快速创建标准化项目结构。它支持Python、JavaScript等多种语言，主要优势包括提高开发效率、确保项目一致性及灵活定制。安装只需pip命令，使用时可从GitHub等来源获取模板，交互式配置变量后自动生成项目框架。开发者还能自定义模板，通过cookiecutter.json定义变量，利用Jinja2语法实现动态内容。进阶功能包含非交互式生成、模板钩子脚本等，团队协作时可共享模板仓库统一规范。

2025-06-26 14:31:22 1170

原创常见ChimeraX命令行操作

常见ChimeraX命令行操作

2025-06-04 10:55:57 3234

原创蛋白质设计软件LigandMPNN介绍

LigandMPNN 是一种用于蛋白质设计（protein design）的深度学习模型，基于 ProteinMPNN 的架构扩展而来，专为配体结合蛋白质（ligand-binding proteins）设计而优化。它是 2023 年由 David Baker 团队（华盛顿大学蛋白质设计研究所，IPD）发布的，旨在设计与小分子、肽或其他配体相互作用的蛋白质序列。

2025-06-03 21:14:52 1129

原创蛋白质结构预测软件openfold介绍

openfold 是一个用 Python 和 PyTorch 实现的 AlphaFold2 的开源复现版，旨在提升蛋白质结构预测的可复现性、可扩展性以及研究友好性。它允许研究者在不开源 DeepMind 原始代码的情况下，自由地进行蛋白结构预测的训练和推理，并支持自定义模型改进。

2025-06-03 20:20:56 867 1

原创分子进化分析软件MEGA介绍

MEGA（Molecular Evolutionary Genetics Analysis）是一款用于分析分子序列（DNA、RNA、蛋白质）的软件

2025-06-03 19:59:38 1037

原创 dali搜索结果筛选

Python 脚本示例，它将从 DALI 比对输出txt文件中自动筛选同源结构，特别是远源同源，并以表格形式输出符合条件的比对项。

2025-05-22 10:25:16 344

原创 dali本地安装和使用

Dali（Distance-matrix ALIgnment）是一种广泛使用的蛋白质结构比对工具，主要用于比较蛋白质三维结构之间的相似性。它通过计算蛋白质结构之间的距离矩阵来评估结构之间的相似性，并生成比对结果。

2025-05-21 20:28:15 955 1

原创 ChimeraX介绍

UCSF ChimeraX 是一款由美国加州大学旧金山分校（UCSF）开发的下一代分子可视化软件，是经典的 UCSF Chimera 的继任者。它集成了强大的分子结构可视化、分析、建模和动画功能，广泛应用于结构生物学、药物设计、分子建模等领域。

2025-05-20 16:52:08 1361

原创 PyMOL命令行和脚本

PyMOL 的命令行（也就是 PyMOL 命令）既能够在 Python 脚本里运用，也可以在 PyMOL 软件自身的命令输入框（PyMOL>）中直接输入。二者在具体使用时存在一些细微差别。

2025-05-19 20:55:25 1017

原创 PyMOL结构对齐方式

在 PyMOL 中，对齐（Alignment）是一项核心功能，主要用于比较和叠加不同的分子结构。这对于研究蛋白质的构象变化、序列同源性以及进行结构比对非常重要。

2025-05-19 20:48:34 1910

原创 pymol包安装和使用

PyMOL 是一款分子可视化软件，而pymol则是其对应的 Python 包，借助它能够实现对 PyMOL 的编程控制。

2025-05-19 17:38:39 875

原创 Foldseek结构搜索结果筛选

Foldseek 同源结构搜索默认输出字段有：query、target、fident、alnlen、mismatch、gapopen、qstart、qend、tstart、tend、evaluate、bits，但可以用--format-output 输出选项进行自定义，例如--format-output“query、target，qaln，taln”以制表符分隔的格式返回查询和目标加入以及成对对齐。

2025-05-19 10:35:00 812

原创批量下载AlphaFold结构

python脚本批量下载AlphaFold结构。

2025-05-18 19:45:15 582

原创 UniRef100 ID 转换 UniProtKB ID

UniProtKBID是UniProt数据库中蛋白质条目的唯一标识符，分为Swiss-Prot和TrEMBL两个分支。AlphaFold预测结构基于UniProtKB的AccessionID生成。UniRef100是UniProt Reference Clusters数据库的一个层级，将100%序列相同的蛋白质聚类成一个单元，每个聚类有一个代表序列，通常来自UniProtKB。UniRef100ID代表整个完全一致的序列簇，而不是单个蛋白。要从UniRef100ID获取代表的UniProtKBID，可以通过

2025-05-18 18:08:14 843

原创 Foldseek本地安装和使用

FoldSeek 是一种极快的蛋白质结构搜索工具，支持多种输入格式（PDB/mmCIF/AlphaFold-predicted structures），在本地运行效果极佳。

2025-05-18 10:52:28 1561

原创 Foldseek在线蛋白质结构搜索

Foldseek 是由韩国首尔大学 Martin Steinegger 团队开发的蛋白质结构相似性搜索工具，其核心技术基于 3Di（三维相互作用字母表）和 MMseqs2 框架，实现了速度与灵敏度的突破。

2025-05-18 09:02:30 1853

原创 ESMFold在线预测蛋白质结构

ESMFold 是由 Meta AI（前 Facebook AI）开发的一种基于语言模型的蛋白质结构预测工具，它比 AlphaFold 更快，能够在几秒至几分钟内预测中小型蛋白质的三维结构。

2025-05-18 08:33:44 992

原创 TrimAl介绍

TrimAl （trim alignment）是一个用于从多序列比对MSA结果中自动去除质量差的区域（gap 多、保守性低），保留可靠的同源区域，提高进化树的准确性，常用于系统发育分析前的对齐质量控制，支持格式：FASTA, CLUSTAL, PHYLIP 等。

2025-05-14 10:33:26 1181

原创 python ete3包介绍

ETE3（Evolutionary Tree Environment 3）是一个用于构建、分析和可视化进化树的 Python 包。它提供了一套完整的工具，支持从简单的树操作到复杂的系统发育分析，广泛应用于生物信息学和进化生物学研究。

2025-05-12 16:39:49 769

原创 T-Coffee 多序列比对软件介绍

T-Coffee (Tree-based Consistency Objective Function For alignment Evaluation)是一款多序列比对 (Multiple Sequence Alignment, MSA) 软件核心特点：一致性加权 (Consistency-based alignment)

2025-05-10 09:29:35 1202

原创多序列比对软件 Clustal Omega 介绍

Clustal Omega 是一款广泛使用的多序列比对工具，由欧洲生物信息学研究所（EMBL-EBI）开发，于 2011 年正式发布。它是经典序列比对工具 Clustal W 和 Clustal X 的升级版本，旨在提供更高效、准确的大规模多序列比对解决方案，尤其适用于处理数百至数千条序列的复杂数据集。

2025-05-09 19:45:44 1850

原创 InterProScan介绍

InterProScan 是欧洲生物信息研究所 (EMBL-EBI) 开发的一个功能强大的生物序列分析工具，用于将蛋白质序列注释为已知的蛋白质家族、结构域和功能位点。

2025-05-08 15:34:48 1220

原创 CentOS 7 安装OpenJDK 17 JRE

CentOS 7 自带的java 版本为：java version "1.8.0_311"，有些软件的运行需要更高的java版。CentOS 7 自带的默认仓库里没有 OpenJDK 17，但是 Adoptium 项目（前身 AdoptOpenJDK）提供了稳定的 OpenJDK 17 版本。

2025-05-07 17:43:24 1446

原创 HHsuite3 的 HHblits 和 HHsearch比较

HHsearch 在远源同源检测中更灵敏，因其直接基于双 Profile HMM 的概率对齐，能捕捉序列相似性之外的结构和进化保守信号；而 HHblits 作为加速版迭代工具，通过扩大同源序列池间接提升灵敏度，是大规模数据分析的首选。两者互补，共同构成 HH-suite 高灵敏度搜索的核心工具。

2025-05-06 19:53:10 683

原创 Linux /dev/null文件用法介绍

在类 Unix 系统（如 Linux、macOS）里，/dev/null 是一个特殊的设备文件，常被称作 “黑洞” 或者 “空设备”。它的作用是接收并丢弃所有写入的数据，且从它读取数据时会马上返回文件结束符。

2025-05-05 12:05:03 745

原创 HHsuite多序列比对格式转换脚本reformat.pl介绍

reformat.pl 是 HH-suite 工具包中的一个格式转换脚本用于快速转换多序列比对 (MSA) 文件格式，让比对结果能在不同软件/流程中通用。

2025-05-05 11:57:13 584

原创多序列比对软件MAFFT介绍

MAFFT（Multiple Alignment using Fast Fourier Transform）是一款广泛使用且高效的多序列比对软件，由日本京都大学的Katoh Kazutaka等人开发，最早发布于2002年，并持续迭代优化至今。

2025-05-05 11:49:41 1230

原创多序列比对可视化和分析软件Jalview介绍

Jalview 是一款功能强大且广泛使用的多序列比对可视化和分析软件。

2025-05-05 11:37:40 1199

原创美国国家生物技术信息中心NCBI介绍

美国国家生物技术信息中心（National Center for Biotechnology Information，简称 NCBI）是全球生物医学领域最权威的综合性数据资源与技术平台之一，隶属于美国国立卫生研究院（NIH）下属的国家医学图书馆（NLM）。

2025-04-30 19:13:53 3560

原创 AlphaFold蛋白质结构数据库介绍

AlphaFold Protein Structure Database (AlphaFold DB) 是 DeepMind + EMBL-EBI 合作开发的公开蛋白质结构预测数据库，是利用 AlphaFold2/AlphaFold3 AI模型预测的全基因组级蛋白质三维结构库。

2025-04-30 17:37:27 1919

原创美国国立卫生研究院NIH介绍

NIH(National Institutes of Health) 是美国联邦政府下属的国家级生物医学研究机构，隶属于美国卫生与公众服务部 (HHS)

2025-04-30 16:09:01 2159

原创蛋白质数据库UniProt介绍

UniProt 是全球最权威、最广泛使用的蛋白质序列与功能信息数据库。

2025-04-30 15:52:19 1896

原创蛋白质数据库InterPro介绍

InterPro 是一个综合性的蛋白质家族、结构域和功能位点注释数据库，由欧洲生物信息研究所（EMBL-EBI）维护。它的核心目标是通过整合多个蛋白质签名数据库，为蛋白质序列提供统一的注释，帮助研究人员识别蛋白质的功能、结构域、家族关系等。

2025-04-30 15:10:40 1479

原创 EMBL-EBI介绍

欧洲生物信息学研究所（EMBL-EBI，European Molecular Biology Laboratory - European Bioinformatics Institute）位于英国剑桥附近的欣克斯顿，它是欧洲分子生物学实验室（EMBL）五个分部之一。EMBL 是一个由 27 个国家组成的政府间组织，旨在支持基础生物科学研究。EMBL - EBI 主要专注于生物信息学领域，其使命是为全球科研界提供生物信息资源和数据分析服务。

2025-04-30 15:04:51 1582

空空如也

空空如也