- 博客(1442)
- 收藏
- 关注
原创 Bioconda 介绍
Bioconda是一个基于Conda的生物信息学开源软件包管理平台,专为解决生物信息工具的安装、版本控制和环境隔离问题而设计。其核心特点包括:专注生物信息学工具(覆盖基因组学、转录组学等领域10000+工具);基于Conda的环境隔离机制,可自动处理复杂依赖链;跨平台兼容Linux/macOS;与Snakemake等流程工具无缝衔接。安装需先配置Miniconda并添加Bioconda仓库源,支持创建独立环境、安装指定版本工具及导出环境配置。虽然存在部分工具更新滞后和Windows支持有限等局限性,但Bio
2026-01-22 20:44:42
305
原创 nf-core介绍
nf-core是一个基于Nextflow的开源生物信息学分析流程社区项目,提供标准化、可复现的分析工作流。其核心特点包括:即插即用(自带测试数据和容器镜像)、社区共建(GitHub公开协作)和跨平台支持(适配本地/HPC/云环境)。官网提供流程检索、文档查询和社区交流功能。主要工具包括nf-core命令行工具和Nextflow运行时,支持流程检索、创建、测试和更新。典型流程涵盖转录组、变异检测、单细胞等分析,所有流程遵循严格的开发规范,包括语法模板、依赖管理、测试验证等要求。项目通过Slack社区提供技术支
2026-01-22 20:40:06
307
原创 工作流管理工具Nextflow 和 Snakemake介绍
Nextflow和Snakemake是两大生物信息学工作流管理工具,各有优势。Nextflow基于Groovy/DSL2,擅长大规模数据处理,支持云平台和强容错机制,适合分布式计算场景。Snakemake采用纯Python语法,规则驱动,环境管理灵活,更适合中小型流程和Python开发者。两者均支持容器化,解决科研计算的可复现性问题。选择依据:Python背景/轻量流程选Snakemake;大规模/分布式需求选Nextflow。
2026-01-22 20:31:48
369
原创 Singularity介绍、安装和使用
Singularity(现名Apptainer)是一款专为HPC和科研设计的容器工具,相比Docker具有安全优势:非root运行、支持HPC硬件(GPU/MPI)、单文件镜像格式。安装需Linux系统,通过Go语言编译,包含依赖包安装、源码编译等步骤。基础使用包括镜像拉取(支持Docker镜像转换)、容器运行(shell/exec/run模式)、目录挂载和自定义镜像构建。特别适合集群环境,支持GPU任务(--nv参数)和SLURM作业提交。其核心特点是安全、HPC友好和镜像便携性,是科研计算场景的理想容器
2026-01-22 20:28:18
510
原创 Docker 介绍、安装与使用
Docker = 轻量虚拟机 + 软件安装包 + 运行环境三合一;安装→ 添加官方源 →→ 启动服务;使用→pull镜像 →run容器 → 挂载目录即可分析 NGS 数据。装好 Docker 后,你就可以直接docker run任何生物信息工具镜像,告别繁琐依赖安装!
2026-01-22 20:19:41
452
原创 Docker 与 Singularity 镜像实战指南
Docker:适合个人开发、本地调试、构建新工具。:适合大规模生信数据分析、在 HPC/超算上运行。核心建议永远在镜像名和文件名中保留版本号。
2026-01-22 19:38:17
523
原创 项目骨架生成工具Cookiecutter介绍
Cookiecutter是一款便捷的项目骨架生成工具,通过模板化方式快速创建标准化项目结构。它支持Python、JavaScript等多种语言,主要优势包括提高开发效率、确保项目一致性及灵活定制。安装只需pip命令,使用时可从GitHub等来源获取模板,交互式配置变量后自动生成项目框架。开发者还能自定义模板,通过cookiecutter.json定义变量,利用Jinja2语法实现动态内容。进阶功能包含非交互式生成、模板钩子脚本等,团队协作时可共享模板仓库统一规范。
2025-06-26 14:31:22
1170
原创 蛋白质设计软件LigandMPNN介绍
LigandMPNN 是一种用于蛋白质设计(protein design)的深度学习模型,基于 ProteinMPNN 的架构扩展而来,专为配体结合蛋白质(ligand-binding proteins)设计而优化。它是 2023 年由 David Baker 团队(华盛顿大学蛋白质设计研究所,IPD)发布的,旨在设计与小分子、肽或其他配体相互作用的蛋白质序列。
2025-06-03 21:14:52
1129
原创 蛋白质结构预测软件openfold介绍
openfold 是一个用 Python 和 PyTorch 实现的 AlphaFold2 的开源复现版,旨在提升蛋白质结构预测的可复现性、可扩展性以及研究友好性。它允许研究者在不开源 DeepMind 原始代码的情况下,自由地进行蛋白结构预测的训练和推理,并支持自定义模型改进。
2025-06-03 20:20:56
867
1
原创 分子进化分析软件MEGA介绍
MEGA(Molecular Evolutionary Genetics Analysis) 是一款用于分析分子序列(DNA、RNA、蛋白质)的软件
2025-06-03 19:59:38
1037
原创 dali搜索结果筛选
Python 脚本示例,它将从 DALI 比对输出txt文件中自动筛选同源结构,特别是远源同源,并以表格形式输出符合条件的比对项。
2025-05-22 10:25:16
344
原创 dali本地安装和使用
Dali(Distance-matrix ALIgnment)是一种广泛使用的蛋白质结构比对工具,主要用于比较蛋白质三维结构之间的相似性。它通过计算蛋白质结构之间的距离矩阵来评估结构之间的相似性,并生成比对结果。
2025-05-21 20:28:15
955
1
原创 ChimeraX介绍
UCSF ChimeraX 是一款由美国加州大学旧金山分校(UCSF)开发的下一代分子可视化软件,是经典的 UCSF Chimera 的继任者。它集成了强大的分子结构可视化、分析、建模和动画功能,广泛应用于结构生物学、药物设计、分子建模等领域。
2025-05-20 16:52:08
1361
原创 PyMOL命令行和脚本
PyMOL 的命令行(也就是 PyMOL 命令)既能够在 Python 脚本里运用,也可以在 PyMOL 软件自身的命令输入框(PyMOL>)中直接输入。二者在具体使用时存在一些细微差别。
2025-05-19 20:55:25
1017
原创 PyMOL结构对齐方式
在 PyMOL 中,对齐(Alignment)是一项核心功能,主要用于比较和叠加不同的分子结构。这对于研究蛋白质的构象变化、序列同源性以及进行结构比对非常重要。
2025-05-19 20:48:34
1910
原创 Foldseek结构搜索结果筛选
Foldseek 同源结构搜索默认输出字段有:query、target、fident、alnlen、mismatch、gapopen、qstart、qend、tstart、tend、evaluate、bits,但可以用--format-output 输出选项进行自定义,例如--format-output“query、target,qaln,taln”以制表符分隔的格式返回查询和目标加入以及成对对齐。
2025-05-19 10:35:00
812
原创 UniRef100 ID 转换 UniProtKB ID
UniProtKBID是UniProt数据库中蛋白质条目的唯一标识符,分为Swiss-Prot和TrEMBL两个分支。AlphaFold预测结构基于UniProtKB的AccessionID生成。UniRef100是UniProt Reference Clusters数据库的一个层级,将100%序列相同的蛋白质聚类成一个单元,每个聚类有一个代表序列,通常来自UniProtKB。UniRef100ID代表整个完全一致的序列簇,而不是单个蛋白。要从UniRef100ID获取代表的UniProtKBID,可以通过
2025-05-18 18:08:14
843
原创 Foldseek本地安装和使用
FoldSeek 是一种极快的蛋白质结构搜索工具,支持多种输入格式(PDB/mmCIF/AlphaFold-predicted structures),在本地运行效果极佳。
2025-05-18 10:52:28
1561
原创 Foldseek在线蛋白质结构搜索
Foldseek 是由韩国首尔大学 Martin Steinegger 团队开发的蛋白质结构相似性搜索工具,其核心技术基于 3Di(三维相互作用字母表) 和 MMseqs2 框架,实现了速度与灵敏度的突破。
2025-05-18 09:02:30
1853
原创 ESMFold在线预测蛋白质结构
ESMFold 是由 Meta AI(前 Facebook AI)开发的一种 基于语言模型的蛋白质结构预测工具,它比 AlphaFold 更快,能够在几秒至几分钟内预测中小型蛋白质的三维结构。
2025-05-18 08:33:44
992
原创 TrimAl介绍
TrimAl (trim alignment)是一个用于从多序列比对MSA结果中自动去除质量差的区域(gap 多、保守性低),保留可靠的同源区域,提高进化树的准确性,常用于系统发育分析前的对齐质量控制,支持格式:FASTA, CLUSTAL, PHYLIP 等。
2025-05-14 10:33:26
1181
原创 python ete3包介绍
ETE3(Evolutionary Tree Environment 3)是一个用于构建、分析和可视化进化树的 Python 包。它提供了一套完整的工具,支持从简单的树操作到复杂的系统发育分析,广泛应用于生物信息学和进化生物学研究。
2025-05-12 16:39:49
769
原创 T-Coffee 多序列比对软件介绍
T-Coffee (Tree-based Consistency Objective Function For alignment Evaluation)是一款多序列比对 (Multiple Sequence Alignment, MSA) 软件核心特点:一致性加权 (Consistency-based alignment)
2025-05-10 09:29:35
1202
原创 多序列比对软件 Clustal Omega 介绍
Clustal Omega 是一款广泛使用的多序列比对工具,由欧洲生物信息学研究所(EMBL-EBI)开发,于 2011 年正式发布。它是经典序列比对工具 Clustal W 和 Clustal X 的升级版本,旨在提供更高效、准确的大规模多序列比对解决方案,尤其适用于处理数百至数千条序列的复杂数据集。
2025-05-09 19:45:44
1850
原创 InterProScan介绍
InterProScan 是欧洲生物信息研究所 (EMBL-EBI) 开发的一个功能强大的生物序列分析工具,用于将蛋白质序列注释为已知的蛋白质家族、结构域和功能位点。
2025-05-08 15:34:48
1220
原创 CentOS 7 安装OpenJDK 17 JRE
CentOS 7 自带的java 版本为:java version "1.8.0_311", 有些软件的运行需要更高的java版。CentOS 7 自带的默认仓库里 没有 OpenJDK 17,但是 Adoptium 项目(前身 AdoptOpenJDK)提供了稳定的 OpenJDK 17 版本。
2025-05-07 17:43:24
1446
原创 HHsuite3 的 HHblits 和 HHsearch比较
HHsearch 在远源同源检测中更灵敏,因其直接基于双 Profile HMM 的概率对齐,能捕捉序列相似性之外的结构和进化保守信号;而 HHblits 作为加速版迭代工具,通过扩大同源序列池间接提升灵敏度,是大规模数据分析的首选。两者互补,共同构成 HH-suite 高灵敏度搜索的核心工具。
2025-05-06 19:53:10
683
原创 Linux /dev/null文件用法介绍
在类 Unix 系统(如 Linux、macOS)里,/dev/null 是一个特殊的设备文件,常被称作 “黑洞” 或者 “空设备”。它的作用是接收并丢弃所有写入的数据,且从它读取数据时会马上返回文件结束符。
2025-05-05 12:05:03
745
原创 HHsuite多序列比对格式转换脚本reformat.pl介绍
reformat.pl 是 HH-suite 工具包中的一个 格式转换脚本 用于 快速转换多序列比对 (MSA) 文件格式,让比对结果能在不同软件/流程中通用。
2025-05-05 11:57:13
584
原创 多序列比对软件MAFFT介绍
MAFFT(Multiple Alignment using Fast Fourier Transform)是一款广泛使用且高效的多序列比对软件,由日本京都大学的Katoh Kazutaka等人开发,最早发布于2002年,并持续迭代优化至今。
2025-05-05 11:49:41
1230
原创 美国国家生物技术信息中心NCBI介绍
美国国家生物技术信息中心(National Center for Biotechnology Information,简称 NCBI)是全球生物医学领域最权威的综合性数据资源与技术平台之一,隶属于美国国立卫生研究院(NIH)下属的国家医学图书馆(NLM)。
2025-04-30 19:13:53
3560
原创 AlphaFold蛋白质结构数据库介绍
AlphaFold Protein Structure Database (AlphaFold DB) 是 DeepMind + EMBL-EBI 合作开发的公开蛋白质结构预测数据库,是利用 AlphaFold2/AlphaFold3 AI模型 预测的全基因组级蛋白质三维结构库。
2025-04-30 17:37:27
1919
原创 美国国立卫生研究院NIH介绍
NIH(National Institutes of Health) 是美国联邦政府下属的国家级生物医学研究机构,隶属于 美国卫生与公众服务部 (HHS)
2025-04-30 16:09:01
2159
原创 蛋白质数据库InterPro介绍
InterPro 是一个综合性的蛋白质家族、结构域和功能位点注释数据库,由欧洲生物信息研究所(EMBL-EBI)维护。它的核心目标是通过整合多个蛋白质签名数据库,为蛋白质序列提供统一的注释,帮助研究人员识别蛋白质的功能、结构域、家族关系等。
2025-04-30 15:10:40
1479
原创 EMBL-EBI介绍
欧洲生物信息学研究所(EMBL-EBI,European Molecular Biology Laboratory - European Bioinformatics Institute)位于英国剑桥附近的欣克斯顿,它是欧洲分子生物学实验室(EMBL)五个分部之一。EMBL 是一个由 27 个国家组成的政府间组织,旨在支持基础生物科学研究。EMBL - EBI 主要专注于生物信息学领域,其使命是为全球科研界提供生物信息资源和数据分析服务。
2025-04-30 15:04:51
1582
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅