自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1442)
  • 收藏
  • 关注

原创 Bioconda 介绍

Bioconda是一个基于Conda的生物信息学开源软件包管理平台,专为解决生物信息工具的安装、版本控制和环境隔离问题而设计。其核心特点包括:专注生物信息学工具(覆盖基因组学、转录组学等领域10000+工具);基于Conda的环境隔离机制,可自动处理复杂依赖链;跨平台兼容Linux/macOS;与Snakemake等流程工具无缝衔接。安装需先配置Miniconda并添加Bioconda仓库源,支持创建独立环境、安装指定版本工具及导出环境配置。虽然存在部分工具更新滞后和Windows支持有限等局限性,但Bio

2026-01-22 20:44:42 305

原创 nf-core介绍

nf-core是一个基于Nextflow的开源生物信息学分析流程社区项目,提供标准化、可复现的分析工作流。其核心特点包括:即插即用(自带测试数据和容器镜像)、社区共建(GitHub公开协作)和跨平台支持(适配本地/HPC/云环境)。官网提供流程检索、文档查询和社区交流功能。主要工具包括nf-core命令行工具和Nextflow运行时,支持流程检索、创建、测试和更新。典型流程涵盖转录组、变异检测、单细胞等分析,所有流程遵循严格的开发规范,包括语法模板、依赖管理、测试验证等要求。项目通过Slack社区提供技术支

2026-01-22 20:40:06 307

原创 工作流管理工具Nextflow 和 Snakemake介绍

Nextflow和Snakemake是两大生物信息学工作流管理工具,各有优势。Nextflow基于Groovy/DSL2,擅长大规模数据处理,支持云平台和强容错机制,适合分布式计算场景。Snakemake采用纯Python语法,规则驱动,环境管理灵活,更适合中小型流程和Python开发者。两者均支持容器化,解决科研计算的可复现性问题。选择依据:Python背景/轻量流程选Snakemake;大规模/分布式需求选Nextflow。

2026-01-22 20:31:48 369

原创 Singularity介绍、安装和使用

Singularity(现名Apptainer)是一款专为HPC和科研设计的容器工具,相比Docker具有安全优势:非root运行、支持HPC硬件(GPU/MPI)、单文件镜像格式。安装需Linux系统,通过Go语言编译,包含依赖包安装、源码编译等步骤。基础使用包括镜像拉取(支持Docker镜像转换)、容器运行(shell/exec/run模式)、目录挂载和自定义镜像构建。特别适合集群环境,支持GPU任务(--nv参数)和SLURM作业提交。其核心特点是安全、HPC友好和镜像便携性,是科研计算场景的理想容器

2026-01-22 20:28:18 510

原创 Docker 介绍、安装与使用

Docker = 轻量虚拟机 + 软件安装包 + 运行环境三合一;安装→ 添加官方源 →→ 启动服务;使用→pull镜像 →run容器 → 挂载目录即可分析 NGS 数据。装好 Docker 后,你就可以直接docker run任何生物信息工具镜像,告别繁琐依赖安装!

2026-01-22 20:19:41 452

原创 Docker 与 Singularity 镜像实战指南

Docker:适合个人开发、本地调试、构建新工具。:适合大规模生信数据分析、在 HPC/超算上运行。核心建议永远在镜像名和文件名中保留版本号。

2026-01-22 19:38:17 523

原创 项目骨架生成工具Cookiecutter介绍

Cookiecutter是一款便捷的项目骨架生成工具,通过模板化方式快速创建标准化项目结构。它支持Python、JavaScript等多种语言,主要优势包括提高开发效率、确保项目一致性及灵活定制。安装只需pip命令,使用时可从GitHub等来源获取模板,交互式配置变量后自动生成项目框架。开发者还能自定义模板,通过cookiecutter.json定义变量,利用Jinja2语法实现动态内容。进阶功能包含非交互式生成、模板钩子脚本等,团队协作时可共享模板仓库统一规范。

2025-06-26 14:31:22 1170

原创 常见ChimeraX命令行操作

常见ChimeraX命令行操作

2025-06-04 10:55:57 3234

原创 蛋白质设计软件LigandMPNN介绍

LigandMPNN 是一种用于蛋白质设计(protein design)的深度学习模型,基于 ProteinMPNN 的架构扩展而来,专为配体结合蛋白质(ligand-binding proteins)设计而优化。它是 2023 年由 David Baker 团队(华盛顿大学蛋白质设计研究所,IPD)发布的,旨在设计与小分子、肽或其他配体相互作用的蛋白质序列。

2025-06-03 21:14:52 1129

原创 蛋白质结构预测软件openfold介绍

openfold 是一个用 Python 和 PyTorch 实现的 AlphaFold2 的开源复现版,旨在提升蛋白质结构预测的可复现性、可扩展性以及研究友好性。它允许研究者在不开源 DeepMind 原始代码的情况下,自由地进行蛋白结构预测的训练和推理,并支持自定义模型改进。

2025-06-03 20:20:56 867 1

原创 分子进化分析软件MEGA介绍

MEGA(Molecular Evolutionary Genetics Analysis) 是一款用于分析分子序列(DNA、RNA、蛋白质)的软件

2025-06-03 19:59:38 1037

原创 dali搜索结果筛选

Python 脚本示例,它将从 DALI 比对输出txt文件中自动筛选同源结构,特别是远源同源,并以表格形式输出符合条件的比对项。

2025-05-22 10:25:16 344

原创 dali本地安装和使用

Dali(Distance-matrix ALIgnment)是一种广泛使用的蛋白质结构比对工具,主要用于比较蛋白质三维结构之间的相似性。它通过计算蛋白质结构之间的距离矩阵来评估结构之间的相似性,并生成比对结果。

2025-05-21 20:28:15 955 1

原创 ChimeraX介绍

UCSF ChimeraX 是一款由美国加州大学旧金山分校(UCSF)开发的下一代分子可视化软件,是经典的 UCSF Chimera 的继任者。它集成了强大的分子结构可视化、分析、建模和动画功能,广泛应用于结构生物学、药物设计、分子建模等领域。

2025-05-20 16:52:08 1361

原创 PyMOL命令行和脚本

PyMOL 的命令行(也就是 PyMOL 命令)既能够在 Python 脚本里运用,也可以在 PyMOL 软件自身的命令输入框(PyMOL>)中直接输入。二者在具体使用时存在一些细微差别。

2025-05-19 20:55:25 1017

原创 PyMOL结构对齐方式

在 PyMOL 中,对齐(Alignment)是一项核心功能,主要用于比较和叠加不同的分子结构。这对于研究蛋白质的构象变化、序列同源性以及进行结构比对非常重要。

2025-05-19 20:48:34 1910

原创 pymol包安装和使用

PyMOL 是一款分子可视化软件,而pymol则是其对应的 Python 包,借助它能够实现对 PyMOL 的编程控制。

2025-05-19 17:38:39 875

原创 Foldseek结构搜索结果筛选

Foldseek 同源结构搜索默认输出字段有:query、target、fident、alnlen、mismatch、gapopen、qstart、qend、tstart、tend、evaluate、bits,但可以用--format-output 输出选项进行自定义,例如--format-output“query、target,qaln,taln”以制表符分隔的格式返回查询和目标加入以及成对对齐。

2025-05-19 10:35:00 812

原创 批量下载AlphaFold结构

python脚本批量下载AlphaFold结构。

2025-05-18 19:45:15 582

原创 UniRef100 ID 转换 UniProtKB ID

UniProtKBID是UniProt数据库中蛋白质条目的唯一标识符,分为Swiss-Prot和TrEMBL两个分支。AlphaFold预测结构基于UniProtKB的AccessionID生成。UniRef100是UniProt Reference Clusters数据库的一个层级,将100%序列相同的蛋白质聚类成一个单元,每个聚类有一个代表序列,通常来自UniProtKB。UniRef100ID代表整个完全一致的序列簇,而不是单个蛋白。要从UniRef100ID获取代表的UniProtKBID,可以通过

2025-05-18 18:08:14 843

原创 Foldseek本地安装和使用

FoldSeek 是一种极快的蛋白质结构搜索工具,支持多种输入格式(PDB/mmCIF/AlphaFold-predicted structures),在本地运行效果极佳。

2025-05-18 10:52:28 1561

原创 Foldseek在线蛋白质结构搜索

Foldseek 是由韩国首尔大学 Martin Steinegger 团队开发的蛋白质结构相似性搜索工具,其核心技术基于 3Di(三维相互作用字母表) 和 MMseqs2 框架,实现了速度与灵敏度的突破。

2025-05-18 09:02:30 1853

原创 ESMFold在线预测蛋白质结构

ESMFold 是由 Meta AI(前 Facebook AI)开发的一种 基于语言模型的蛋白质结构预测工具,它比 AlphaFold 更快,能够在几秒至几分钟内预测中小型蛋白质的三维结构。

2025-05-18 08:33:44 992

原创 TrimAl介绍

TrimAl (trim alignment)是一个用于从多序列比对MSA结果中自动去除质量差的区域(gap 多、保守性低),保留可靠的同源区域,提高进化树的准确性,常用于系统发育分析前的对齐质量控制,支持格式:FASTA, CLUSTAL, PHYLIP 等。

2025-05-14 10:33:26 1181

原创 python ete3包介绍

ETE3(Evolutionary Tree Environment 3)是一个用于构建、分析和可视化进化树的 Python 包。它提供了一套完整的工具,支持从简单的树操作到复杂的系统发育分析,广泛应用于生物信息学和进化生物学研究。

2025-05-12 16:39:49 769

原创 T-Coffee 多序列比对软件介绍

T-Coffee (Tree-based Consistency Objective Function For alignment Evaluation)是一款多序列比对 (Multiple Sequence Alignment, MSA) 软件核心特点:一致性加权 (Consistency-based alignment)

2025-05-10 09:29:35 1202

原创 多序列比对软件 Clustal Omega 介绍

Clustal Omega 是一款广泛使用的多序列比对工具,由欧洲生物信息学研究所(EMBL-EBI)开发,于 2011 年正式发布。它是经典序列比对工具 Clustal W 和 Clustal X 的升级版本,旨在提供更高效、准确的大规模多序列比对解决方案,尤其适用于处理数百至数千条序列的复杂数据集。

2025-05-09 19:45:44 1850

原创 InterProScan介绍

InterProScan 是欧洲生物信息研究所 (EMBL-EBI) 开发的一个功能强大的生物序列分析工具,用于将蛋白质序列注释为已知的蛋白质家族、结构域和功能位点。

2025-05-08 15:34:48 1220

原创 CentOS 7 安装OpenJDK 17 JRE

CentOS 7 自带的java 版本为:java version "1.8.0_311", 有些软件的运行需要更高的java版。CentOS 7 自带的默认仓库里 没有 OpenJDK 17,但是 Adoptium 项目(前身 AdoptOpenJDK)提供了稳定的 OpenJDK 17 版本。

2025-05-07 17:43:24 1446

原创 HHsuite3 的 HHblits 和 HHsearch比较

HHsearch 在远源同源检测中更灵敏,因其直接基于双 Profile HMM 的概率对齐,能捕捉序列相似性之外的结构和进化保守信号;而 HHblits 作为加速版迭代工具,通过扩大同源序列池间接提升灵敏度,是大规模数据分析的首选。两者互补,共同构成 HH-suite 高灵敏度搜索的核心工具。

2025-05-06 19:53:10 683

原创 Linux /dev/null文件用法介绍

在类 Unix 系统(如 Linux、macOS)里,/dev/null 是一个特殊的设备文件,常被称作 “黑洞” 或者 “空设备”。它的作用是接收并丢弃所有写入的数据,且从它读取数据时会马上返回文件结束符。

2025-05-05 12:05:03 745

原创 HHsuite多序列比对格式转换脚本reformat.pl介绍

reformat.pl 是 HH-suite 工具包中的一个 格式转换脚本 用于 快速转换多序列比对 (MSA) 文件格式,让比对结果能在不同软件/流程中通用。

2025-05-05 11:57:13 584

原创 多序列比对软件MAFFT介绍

MAFFT(Multiple Alignment using Fast Fourier Transform)是一款广泛使用且高效的多序列比对软件,由日本京都大学的Katoh Kazutaka等人开发,最早发布于2002年,并持续迭代优化至今。

2025-05-05 11:49:41 1230

原创 多序列比对可视化和分析软件Jalview介绍

Jalview 是一款功能强大且广泛使用的多序列比对可视化和分析软件。

2025-05-05 11:37:40 1199

原创 美国国家生物技术信息中心NCBI介绍

美国国家生物技术信息中心(National Center for Biotechnology Information,简称 NCBI)是全球生物医学领域最权威的综合性数据资源与技术平台之一,隶属于美国国立卫生研究院(NIH)下属的国家医学图书馆(NLM)。

2025-04-30 19:13:53 3560

原创 AlphaFold蛋白质结构数据库介绍

AlphaFold Protein Structure Database (AlphaFold DB) 是 DeepMind + EMBL-EBI 合作开发的公开蛋白质结构预测数据库,是利用 AlphaFold2/AlphaFold3 AI模型 预测的全基因组级蛋白质三维结构库。

2025-04-30 17:37:27 1919

原创 美国国立卫生研究院NIH介绍

NIH(National Institutes of Health) 是美国联邦政府下属的国家级生物医学研究机构,隶属于 美国卫生与公众服务部 (HHS)

2025-04-30 16:09:01 2159

原创 蛋白质数据库UniProt介绍

UniProt 是全球最权威、最广泛使用的蛋白质序列与功能信息数据库。

2025-04-30 15:52:19 1896

原创 蛋白质数据库InterPro介绍

InterPro 是一个综合性的蛋白质家族、结构域和功能位点注释数据库,由欧洲生物信息研究所(EMBL-EBI)维护。它的核心目标是通过整合多个蛋白质签名数据库,为蛋白质序列提供统一的注释,帮助研究人员识别蛋白质的功能、结构域、家族关系等。

2025-04-30 15:10:40 1479

原创 EMBL-EBI介绍

欧洲生物信息学研究所(EMBL-EBI,European Molecular Biology Laboratory - European Bioinformatics Institute)位于英国剑桥附近的欣克斯顿,它是欧洲分子生物学实验室(EMBL)五个分部之一。EMBL 是一个由 27 个国家组成的政府间组织,旨在支持基础生物科学研究。EMBL - EBI 主要专注于生物信息学领域,其使命是为全球科研界提供生物信息资源和数据分析服务。

2025-04-30 15:04:51 1582

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除