生物信息
文章平均质量分 83
1. 生信软件的原理和使用。
2. 生信数据的格式和特征。
子诚之
微信公众号:生信工程师的日常
展开
-
[摘录] 使用linux搭建流程的一些技术细节
set 命令参数作用set -e若指令传回值不等于0,则立即退出shell。set -o pipelineset -x执行指令后,会先显示该指令及所其参数。set -u当执行时使用到未定义变量,则显示错误信息。# 写法1set -euxo pipefail# 写法2bash -euxo pipefail script.shLinux set命令Bash 脚本 set 命令教程Bash 错误处理如果脚本里面有运行失败的命令(返回值非0),原创 2021-06-28 21:40:50 · 81 阅读 · 0 评论 -
生信数据常见文件格式
生信文件格式。原创 2021-05-22 15:28:15 · 226 阅读 · 0 评论 -
Torrent_Suite_Software
1. Plugin System1.1 入门插件是通用分析流程的扩展,表现为在流程不同环节执行的python模块。1.1.1 快速开始'''vi Myplugin/MyPlugin.py # belowzip -r –exclude=*.git* mp.zip MyPluginupload, run'''import subprocessfrom ion.plugin import *class MyPlugin(IonPlugin):# Must inherit from原创 2021-04-12 23:11:16 · 1181 阅读 · 1 评论 -
Perl 入门笔记
文章目录1. 数据类型和结构标量(scalar)数字字符串列表(list)和数组(array)Larry 在20世纪80年代设计创建了 Perl,现在由 Perl5 Porters 团队维护 。Perl 语法简洁,适合处理与文字有关的任务。CPAN 是一个存放用 Perl 编写的软件及其文档的网络存档,在全球有数百个镜像站点。1. 数据类型和结构A variable is a name for a container that holds one or more values.A scalar原创 2021-03-26 17:38:03 · 318 阅读 · 0 评论 -
生信分析流程框架概述
makeCommon Workflow Language (CWL)CWL是一种描述命令行工具并将它们连接在一起以创建工作流的规范。CWL文件使用YAML或JSON格式编写。调用形式一般为 cwl-runner [tool-or-workflow-description] [input-job-settings],即工作流描述和输入文件作为参数提供给CWL运行器。例1. cwl-runner echo.cwl echo_input.yaml#############################原创 2021-03-18 22:50:00 · 2144 阅读 · 0 评论 -
[更新中] NGS常见软件和数据库(肿瘤/遗传病)
变异分析原创 2021-02-27 17:07:59 · 2504 阅读 · 1 评论 -
序列比对(待续)
一、双序列比对动态规划(Dynamic programming)动态规划 (Dynamic programming, DP) 是通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。动态规划常常适用于有重叠子问题和最优子结构性质的问题。https://zh.wikipedia.org/wiki/动态规划重叠子问题:自底向上下面三个函数分别使用了递归、递归+列表、迭代方法求解斐波那契数列。后两种方法仅对重叠子问题求解一次,因而时间复杂度急剧下降。其中迭代呈现的自底向上策略就是动态规划对重原创 2020-07-11 21:12:42 · 1124 阅读 · 0 评论 -
GATK & GATK best practices notes
Usage0. Pipeline IndexVariant DiscoveryGermlineSomaticData pre-processingSingle-sampleSingle-sampleShort variants: SNPs and IndelsSingle-sample & Joint CallingTumor-Normal & Tumor-OnlyCopy Number Variants (CNVs)MultisampleT原创 2020-10-18 22:33:21 · 1270 阅读 · 0 评论 -
注释 bed 文件中 feature 的基因名
需求现有一个 bed 文件,想要知道 feature 对应的基因名(gene symbol)等注释内容。方法1. 使用 UCSC Table browser以人类为例,依次设定以下选项:clade: Mammalgenome: Humanassembly: GRch37/hg19 #基因组版本group: Genes and Gene Prediction Trackstrack: UCSC Genestable: knowGeneregion: 点击 defined regi原创 2020-08-27 20:38:06 · 2525 阅读 · 1 评论