qq_21478261
这个作者很懒,什么都没留下…
展开
-
Omics精进04|临床Gene Panel检测-实验&&生物信息学分析
"pythonic生物人"的第129篇分享。❝本文介绍临床Gene Panel检测的「实验流程」及「生物信息学分析流程」(下图为MSK-IMPACT 468基因panel...原创 2020-12-04 23:58:43 · 978 阅读 · 0 评论 -
NGS数据格式梳理02-SAM/BAM格式最详细解读
全网最全介绍SAM|BAM文件文章。原创 2020-05-08 21:58:34 · 5000 阅读 · 0 评论 -
shell中注释一段代码
红色之间的一段代码备注释掉了。原创 2024-10-28 12:58:44 · 119 阅读 · 0 评论 -
fastp安装
/fastp。原创 2024-10-28 11:39:22 · 19 阅读 · 0 评论 -
clinvar中ReviewStatus
ReviewStatus,详细介绍原创 2024-09-24 17:49:07 · 54 阅读 · 0 评论 -
clinvar数据库variant_summary.txt.gz各列详细介绍
Pathogenic;Pathogenic;used for。原创 2024-09-18 17:25:24 · 145 阅读 · 0 评论 -
hgvs中delins的定义
一个或多个碱基被≥1个的碱基所取代,而且这种变异不包括替换substitution。原创 2024-09-18 17:21:15 · 158 阅读 · 0 评论 -
sed命令中使用变量
以上,将test.txt中的hello替换成了hi。如何在sed命令中传入变量。原创 2024-08-09 12:56:01 · 98 阅读 · 0 评论 -
gff格式转gff3
gt-bed_to_gff3gt bed_to_gff3 test.bed >test.gff3输入test.bed输出test.gff3原创 2024-08-07 11:26:12 · 171 阅读 · 0 评论 -
perl逻辑或||和or区别
|和or都表示逻辑或的区别,||更常用,优先级高于or。原创 2024-08-06 12:49:21 · 87 阅读 · 0 评论 -
vcf中添加ref alt长度到最后两列
使用awk为vcf中添加ref alt长度到最后两列。原创 2024-08-05 16:43:53 · 39 阅读 · 0 评论 -
mac下jupyter notebook ipynb恢复
当前文件夹生成history.txt,历史输入都在。原创 2024-07-30 09:18:17 · 57 阅读 · 0 评论 -
bcftools: error while loading shared libraries: libcrypto.so.1.0.0: cannot open shared object file:
bcftools版本太低。原创 2024-07-28 15:34:12 · 109 阅读 · 0 评论 -
[E::bcf_hdr_parse] Could not parse the header, sample line not found
[E::bcf_hdr_parse] Could not parse the header, sample line not found原创 2024-07-28 15:32:10 · 61 阅读 · 0 评论 -
bam文件染色体号前添加chr
【代码】bam文件染色体号前添加chr。原创 2024-07-26 12:39:01 · 85 阅读 · 0 评论 -
vcf中染色体号列前添加chr并跳过header
【代码】vcf中染色体号列前添加chr并跳过header。原创 2024-07-25 22:31:55 · 64 阅读 · 0 评论 -
vcf按照染色体号chrom和位置pos排序
vcf按照染色体号chr1~chrY和位置pos排序:原创 2024-07-25 22:28:38 · 99 阅读 · 0 评论 -
vcf.gz file, but bcftools says it‘s not compressed with bgzip
报错:解决方法1解决方法2。原创 2024-07-25 22:22:33 · 76 阅读 · 0 评论 -
vcf文件对染色体#CHROM和坐标POS排序
sort -k1,1V -k2,2n test.vcf >test_sorted.vcf原创 2024-07-19 13:22:10 · 147 阅读 · 0 评论 -
awk去掉第5列包含,的行
awk 'index($5, ",") == 0'原创 2024-07-18 22:43:57 · 53 阅读 · 0 评论 -
awk按照文件第2列去重复
awk '!seen[$2]++'依次类推。原创 2024-07-18 22:41:51 · 233 阅读 · 0 评论 -
用可视化的方式学统计学
本次分享一个统计学学习工具:看见统计。看见统计致力于用数据可视化 (使用D3.js完成) 让统计概念更容易理解,源于布朗大学几位作者👇看见统计共有6个章节,下面来看看具体内容,对于一个(性质比较好的)分布,如果我们有足够大的独立同分布的样本,其样本均值会(近似地)呈正态分布,样本数量越大,其分布与正态越接近。动态模拟贝叶斯计算概率所需要的样本信息,拖动图中的数据点,观察它们对回归直线的影响,选择一个t概率分布来生成样本,构造置信区间,原创 2024-07-02 12:39:39 · 107 阅读 · 0 评论 -
查看python conda 配置的源
channels:- defaults。原创 2024-06-14 17:04:34 · 514 阅读 · 0 评论 -
awk传入变量
awk。原创 2024-06-03 21:39:37 · 139 阅读 · 0 评论 -
sort按数据大小排序
t $'\t' #指定test.txt文件的分割符号为\t。-k 20,20 #指定按照文件的第20列排序。-n #按照数字大小排序。-r #从大到小排序。原创 2024-06-03 21:14:59 · 271 阅读 · 0 评论 -
Python统计图制作优雅工具seaborn
seaborn是Python统计图制作最简单的工具,广受好评,「pythonic生物人」打造了一份原创。适合系统学习Python seaborn运用于日常工作,学术数据可视化的伙伴们(适合零基础入门 、老手进阶)。在线图文教程,包含详细目录,原创 2024-05-17 10:50:44 · 425 阅读 · 0 评论 -
基因组坐标转换,hg19 hg38 T2T相互转
支持输入格式。原创 2024-04-30 12:33:07 · 337 阅读 · 0 评论 -
hs37-1kg hs37d5等参考基因组版本选择建议
【代码】参考基因组版本选择建议。原创 2024-04-29 17:49:45 · 189 阅读 · 0 评论 -
RepeatMasker 基因组重复区域文件
3. **milliDiv**:经过比对的序列中的碱基差异率,以千分之一为单位。4. **milliDel**:经过比对的序列中的碱基缺失率,以千分之一为单位。5. **milliIns**:经过比对的序列中的碱基插入率,以千分之一为单位。6. **genoName**:序列所在的染色体或染色体片段的名称。16. **repLeft**:重复序列与原始序列左边界之间的距离。14. **repStart**:重复序列在原始序列上的起始位置。15. **repEnd**:重复序列在原始序列上的终止位置。原创 2024-04-29 16:13:05 · 188 阅读 · 0 评论 -
详细介绍gnomAD
字段含义介绍:原创 2024-04-26 22:50:07 · 103 阅读 · 0 评论 -
for x in `seq 1 22` “X“ “Y“; do echo $x;done
【代码】for x in `seq 1 22` "X" "Y";do echo $x;done。原创 2024-04-26 12:59:34 · 51 阅读 · 0 评论 -
wget断点续传:下载几百G大文件断了继续下载
下载几百G大文件,因为网络不好断了,下载失败,网络好了再重新下载很浪费时间,这时候使用断点续传就可以。#下载文件https://xxxxx.test.gz,保存到本地为test.gz。继续从下载失败的地方下载。原创 2024-04-25 17:23:39 · 1062 阅读 · 0 评论 -
bgzip解压.gz文件并保留原文件
生成test.txt的同时,保留test.txt.bgz。原创 2024-04-25 15:55:34 · 445 阅读 · 0 评论 -
bgzip压缩为.gz,索引为.gz.tbi
生成test.txt.gz。原创 2024-04-16 18:52:24 · 163 阅读 · 0 评论 -
hgvs中的[数字]是什么意思
hgvs中的,例如NM_144670.6(A2ML1):c.462+9GGA中的。原创 2024-03-26 21:30:00 · 190 阅读 · 0 评论 -
awk指定输入分隔符,输出分隔符
FS='@' ,指定输入分割符为@OFS=',',指定输出分割符为,原创 2024-03-26 16:28:43 · 687 阅读 · 0 评论 -
R报错:cannot coerce class ‘“function“’ to a data.frame
使用了R内置函数作为变量,比如sum、mean、max等等。原创 2024-03-09 16:04:57 · 548 阅读 · 0 评论 -
Pandoc is required to build R Markdown vignettes but not available. Please make sure it is installed
缺少系统工具pandoc。原创 2023-12-26 21:47:39 · 450 阅读 · 0 评论 -
皮尔逊Pearson|斯皮尔曼spearman|肯德尔等级kendallta三个系数的使用场景
皮尔逊Pearson|斯皮尔曼spearman|肯德尔等级kendallta三个系数的使用场景原创 2020-08-19 21:36:20 · 7654 阅读 · 1 评论 -
vep Possible precedence issue with control flow operator at Bio/DB/IndexedBase.pm line 805
将IndexedBase.pm第805行的逻辑或运算符or修改为||,是一个很常见的问题,貌似只是个warning,不会导致结果问题,这个报错是由于BioPerl导致,初步解决,结果不受影响(原创 2023-10-20 10:47:05 · 239 阅读 · 0 评论