qq_21478261
这个作者很懒,什么都没留下…
展开
-
Omics精进04|临床Gene Panel检测-实验&&生物信息学分析
"pythonic生物人"的第129篇分享。❝本文介绍临床Gene Panel检测的「实验流程」及「生物信息学分析流程」(下图为MSK-IMPACT 468基因panel...原创 2020-12-04 23:58:43 · 1015 阅读 · 0 评论 -
NGS数据格式梳理02-SAM/BAM格式最详细解读
全网最全介绍SAM|BAM文件文章。原创 2020-05-08 21:58:34 · 5055 阅读 · 0 评论 -
Aspera:基因组数据高速下载利器
将/bin/ascp替换为。原创 2025-01-03 14:14:29 · 43 阅读 · 0 评论 -
找到了Notepad++的完美替代!
一个跨平台的 Notepad++ 重实现(A cross-platform, reimplementation of Notepad++)。这里分享一个Notepad++的完美替代--NotepadNext。Notepad++作者因为曾放言,可能会在开发者代码里下毒而被唾弃。这里分享一个Notepad++的完美替代--NotepadNext。找到自己的系统版本即可,原创 2024-11-30 23:38:56 · 1454 阅读 · 0 评论 -
shell echo双引号和单引号区别
shell echo双引号和单引号区别。原创 2024-11-29 21:15:51 · 156 阅读 · 0 评论 -
HGVS操作工具
This page lists general purpose open source software that manipulates HGVS variant descriptions. Our intention is to help the community find software that aids in the adoption of HGVS Nomenclature. The entries below are provided by the authors; the entries原创 2024-11-06 22:54:00 · 77 阅读 · 0 评论 -
shell中注释一段代码
红色之间的一段代码备注释掉了。原创 2024-10-28 12:58:44 · 244 阅读 · 0 评论 -
fastp安装
/fastp。原创 2024-10-28 11:39:22 · 196 阅读 · 0 评论 -
clinvar中ReviewStatus
ReviewStatus,详细介绍原创 2024-09-24 17:49:07 · 100 阅读 · 0 评论 -
clinvar数据库variant_summary.txt.gz各列详细介绍
Pathogenic;Pathogenic;used for。原创 2024-09-18 17:25:24 · 200 阅读 · 0 评论 -
hgvs中delins的定义
一个或多个碱基被≥1个的碱基所取代,而且这种变异不包括替换substitution。原创 2024-09-18 17:21:15 · 217 阅读 · 0 评论 -
sed命令中使用变量
以上,将test.txt中的hello替换成了hi。如何在sed命令中传入变量。原创 2024-08-09 12:56:01 · 212 阅读 · 0 评论 -
gff格式转gff3
gt-bed_to_gff3gt bed_to_gff3 test.bed >test.gff3输入test.bed输出test.gff3原创 2024-08-07 11:26:12 · 357 阅读 · 0 评论 -
perl逻辑或||和or区别
|和or都表示逻辑或的区别,||更常用,优先级高于or。原创 2024-08-06 12:49:21 · 151 阅读 · 0 评论 -
vcf中添加ref alt长度到最后两列
使用awk为vcf中添加ref alt长度到最后两列。原创 2024-08-05 16:43:53 · 59 阅读 · 0 评论 -
mac下jupyter notebook ipynb恢复
当前文件夹生成history.txt,历史输入都在。原创 2024-07-30 09:18:17 · 83 阅读 · 0 评论 -
bcftools: error while loading shared libraries: libcrypto.so.1.0.0: cannot open shared object file:
bcftools版本太低。原创 2024-07-28 15:34:12 · 227 阅读 · 0 评论 -
[E::bcf_hdr_parse] Could not parse the header, sample line not found
[E::bcf_hdr_parse] Could not parse the header, sample line not found原创 2024-07-28 15:32:10 · 105 阅读 · 0 评论 -
bam文件染色体号前添加chr
【代码】bam文件染色体号前添加chr。原创 2024-07-26 12:39:01 · 145 阅读 · 0 评论 -
vcf中染色体号列前添加chr并跳过header
【代码】vcf中染色体号列前添加chr并跳过header。原创 2024-07-25 22:31:55 · 102 阅读 · 0 评论 -
vcf按照染色体号chrom和位置pos排序
vcf按照染色体号chr1~chrY和位置pos排序:原创 2024-07-25 22:28:38 · 190 阅读 · 0 评论 -
vcf.gz file, but bcftools says it‘s not compressed with bgzip
报错:解决方法1解决方法2。原创 2024-07-25 22:22:33 · 155 阅读 · 0 评论 -
vcf文件对染色体#CHROM和坐标POS排序
sort -k1,1V -k2,2n test.vcf >test_sorted.vcf原创 2024-07-19 13:22:10 · 273 阅读 · 0 评论 -
awk去掉第5列包含,的行
awk 'index($5, ",") == 0'原创 2024-07-18 22:43:57 · 64 阅读 · 0 评论 -
awk按照文件第2列去重复
awk '!seen[$2]++'依次类推。原创 2024-07-18 22:41:51 · 296 阅读 · 0 评论 -
用可视化的方式学统计学
本次分享一个统计学学习工具:看见统计。看见统计致力于用数据可视化 (使用D3.js完成) 让统计概念更容易理解,源于布朗大学几位作者👇看见统计共有6个章节,下面来看看具体内容,对于一个(性质比较好的)分布,如果我们有足够大的独立同分布的样本,其样本均值会(近似地)呈正态分布,样本数量越大,其分布与正态越接近。动态模拟贝叶斯计算概率所需要的样本信息,拖动图中的数据点,观察它们对回归直线的影响,选择一个t概率分布来生成样本,构造置信区间,原创 2024-07-02 12:39:39 · 162 阅读 · 0 评论 -
查看python conda 配置的源
channels:- defaults。原创 2024-06-14 17:04:34 · 753 阅读 · 0 评论 -
awk传入变量
awk。原创 2024-06-03 21:39:37 · 197 阅读 · 0 评论 -
sort按数据大小排序
t $'\t' #指定test.txt文件的分割符号为\t。-k 20,20 #指定按照文件的第20列排序。-n #按照数字大小排序。-r #从大到小排序。原创 2024-06-03 21:14:59 · 390 阅读 · 0 评论 -
Python统计图制作优雅工具seaborn
seaborn是Python统计图制作最简单的工具,广受好评,「pythonic生物人」打造了一份原创。适合系统学习Python seaborn运用于日常工作,学术数据可视化的伙伴们(适合零基础入门 、老手进阶)。在线图文教程,包含详细目录,原创 2024-05-17 10:50:44 · 453 阅读 · 0 评论 -
基因组坐标转换,hg19 hg38 T2T相互转
支持输入格式。原创 2024-04-30 12:33:07 · 613 阅读 · 0 评论 -
hs37-1kg hs37d5等参考基因组版本选择建议
【代码】参考基因组版本选择建议。原创 2024-04-29 17:49:45 · 282 阅读 · 0 评论 -
RepeatMasker 基因组重复区域文件
3. **milliDiv**:经过比对的序列中的碱基差异率,以千分之一为单位。4. **milliDel**:经过比对的序列中的碱基缺失率,以千分之一为单位。5. **milliIns**:经过比对的序列中的碱基插入率,以千分之一为单位。6. **genoName**:序列所在的染色体或染色体片段的名称。16. **repLeft**:重复序列与原始序列左边界之间的距离。14. **repStart**:重复序列在原始序列上的起始位置。15. **repEnd**:重复序列在原始序列上的终止位置。原创 2024-04-29 16:13:05 · 342 阅读 · 0 评论 -
详细介绍gnomAD
字段含义介绍:原创 2024-04-26 22:50:07 · 165 阅读 · 0 评论 -
for x in `seq 1 22` “X“ “Y“; do echo $x;done
【代码】for x in `seq 1 22` "X" "Y";do echo $x;done。原创 2024-04-26 12:59:34 · 66 阅读 · 0 评论 -
wget断点续传:下载几百G大文件断了继续下载
下载几百G大文件,因为网络不好断了,下载失败,网络好了再重新下载很浪费时间,这时候使用断点续传就可以。#下载文件https://xxxxx.test.gz,保存到本地为test.gz。继续从下载失败的地方下载。原创 2024-04-25 17:23:39 · 1425 阅读 · 0 评论 -
bgzip解压.gz文件并保留原文件
生成test.txt的同时,保留test.txt.bgz。原创 2024-04-25 15:55:34 · 698 阅读 · 0 评论 -
bgzip压缩为.gz,索引为.gz.tbi
生成test.txt.gz。原创 2024-04-16 18:52:24 · 287 阅读 · 0 评论 -
hgvs中的[数字]是什么意思
hgvs中的,例如NM_144670.6(A2ML1):c.462+9GGA中的。原创 2024-03-26 21:30:00 · 213 阅读 · 0 评论 -
awk指定输入分隔符,输出分隔符
FS='@' ,指定输入分割符为@OFS=',',指定输出分割符为,原创 2024-03-26 16:28:43 · 924 阅读 · 0 评论