linux
文章平均质量分 61
让学习成为一种生活方式
中国医学科学院&北京协和医学院研究生一枚,生物信息学+合成生物学欢迎交流。如切如嗟,如琢如磨!
展开
-
minimap2安装与使用(v 2.28)生物信息学工具26
Minimap2 是一个多功能的序列比对程序,可以将 DNA 或 mRNA 序列与大型参考数据库进行比对。对于约 10kb 的噪声读长序列,minimap2 比主流长读长比对程序(如 BLASR、BWA-MEM、NGMLR 和 GMAP)快几十倍。对于大于 100bp 的 Illumina 短读长,minimap2 的速度是 BWA-MEM 和 Bowtie2 的三倍,并在模拟数据上同样准确。映射长的噪声基因组读长。如果你为不同的数据类型运行 minimap2,可能需要保留使用不同参数生成的多个索引。原创 2024-07-17 00:40:32 · 1139 阅读 · 0 评论 -
挂载硬盘相关操作-linux004
【代码】挂载硬盘相关操作-linux004。原创 2024-07-16 14:56:24 · 90 阅读 · 0 评论 -
过滤非起始密码子终止密码子的序列-linux005
根据基因组、转录组获取了一些蛋白序列,但是存在可变剪切的情况,即一些序列并没有起始密码子或者终止密码子,这时候要过滤去掉这些序列。即,过滤可变剪切,保留唯一序列。原创 2024-07-16 16:25:32 · 267 阅读 · 0 评论 -
StringTie v2.2.3安装与使用-生物信息学工具25
StringTie使用高效的算法从对齐到参考基因组的批量RNA-Seq读取中恢复转录结构并估计其丰度。它以坐标排序的SAM/BAM/CRAM格式输入剪接对齐,并生成一个GTF输出文件,该文件包含组装的转录结构及其估计的表达水平(FPKM/TPM和碱基覆盖值)。和trinity assembly效果等同。均为转录本组装软件,使用一个即可~StringTie:高效的转录组装和RNA-Seq数据定量工具。原创 2024-07-14 19:58:35 · 448 阅读 · 0 评论 -
解压zip、tar、gz文件--linux003
【代码】解压zip、tar、gz文件--linux003。原创 2024-07-13 11:22:33 · 184 阅读 · 0 评论 -
conda创建、查看、激活、退出、删除环境--linux002
【代码】conda创建、查看、激活、退出、删除环境。原创 2024-07-12 21:54:16 · 564 阅读 · 0 评论 -
QUAST安装及使用v5.2.0(Bioinformatics工具-022)
当前的 QUAST 工具包包括通用的基因组组装工具 QUAST,元基因组数据集扩展 MetaQUAST,用于大基因组(如哺乳动物)的扩展 QUAST-LG,以及用于这些工具的交互式可视化工具 Icarus。通过计算各种指标来评估基因组的组装,包括N50,L50,GC含量等contig基本信息。QUAST(Quality Assessment Tool for Genome Assemblies)是基因组质量评估工具,基于python开发,matplotlib绘图。该工具接受多个组装,因此适合比较。原创 2024-06-09 00:53:29 · 577 阅读 · 0 评论 -
Linux介绍-以CentOS和Ubuntu为例---linux入门01
1.1 Linux的起源与发展Linux操作系统的内核最初由Linus Torvalds在1991年发布,并且迅速得到了全球开发者社区的支持。由于其开源的性质,Linux的发展非常迅速,形成了众多不同的发行版,适用于服务器、桌面、嵌入式系统等各种应用场景。Linux 内核最初只是由芬兰人林纳斯·托瓦兹(Linus Torvalds)在赫尔辛基大学上学时出于个人爱好而编写的。原创 2024-06-06 23:11:11 · 717 阅读 · 0 评论 -
PMAT(组装线粒体基因组)安装及使用(Bioinformatics工具-021)
PMAT 是一个高效的组装工具包,用于利用第三代(HiFi/CLR/ONT)测序数据组装植物线粒体基因组。PMAT 还可以用于组装叶绿体基因组或动物线粒体基因组。原创 2024-06-05 21:13:05 · 696 阅读 · 0 评论 -
jellyfish安装及使用(Bioinformatics工具-020)
K是常数,且一般为奇数(避免正反链混淆)。统计所有reads中所出现的k-mer类型及各类型k-mer的深度(或者频率),绘制特定k-mer下不同深度k-mer片段的频数统计图,通常选择K-mer分布最多的峰为主峰,从而得到基因组大小=K-mer总数/K-mer主峰深度值。由于基因组存在杂合位点和重复序列,k-mer曲线往往不会呈现出良好的泊松分布,而是在主峰前后出现其他的峰,如果存在一定杂合度,会导致在主峰对应的横坐标的二分之一处出现杂合峰,而一定的重复度则会在主峰对应的横坐标的整数倍处出现重复峰。原创 2024-05-24 23:29:41 · 880 阅读 · 0 评论 -
bwa安装及使用v0.7.17(生物信息学工具-018)
BWA是一个用于将DNA序列比对到大型参考基因组(如人类基因组)的软件包。它包含三种算法:BWA-backtrack、BWA-SW和BWA-MEM。第一个算法设计用于 Illumina 测序读取长度最长为100bp,而后两个用于更长序列,范围从70bp到几百万碱基。BWA-MEM和BWA-SW具有类似的特性,如支持长读取和嵌合比对,但通常建议使用BWA-MEM,因为它更快、更准确。对于70-100bp的Illumina读取,BWA-MEM的性能也比BWA-backtrack更好。原创 2024-04-30 21:01:19 · 2548 阅读 · 0 评论 -
python setup.py egg_info did not run successfully-python debug-1
降级pip安装包,亲测有效。原创 2024-04-27 22:51:51 · 186 阅读 · 1 评论 -
二倍体毛白杨(Populus tomentosa Carr.)基因组-春天都是杨树毛子???-文献精读-11
杨树具有广泛的生态地理分布,覆盖北半球,而且种间杂交很常见。毛白杨(Populus tomentosa Carr.)在亚洲东部地区广泛分布和栽培,它在林业、农业、保护和城市园艺中扮演多重重要角色。虽然已有几种杨树的参考基因组,但我们的目标是生成一个非常高质量的毛白杨染色体水平的全新基因组组装,这将作为整个属杂交物种形成的进化和生态研究的参考。在此,我们结合了长读测序和Hi-C支架,呈现了一个高质量的二倍体解析基因组组装。原创 2024-04-26 19:30:32 · 988 阅读 · 0 评论 -
二倍体胡桃树(Juglans regia L.)基因组-文献精读-10
野生种质资源因其特殊的性状表现,对基因挖掘和分子育种至关重要。二倍体解析基因组是全面理解高度杂合物种亚基因组生物学的理想解决方案。本研究调查了中国新疆巩留县的一棵野生胡桃树的基因组,并利用PacBio高保真(HiFi)读取和Hi-C技术,为一个二倍体(hap1)生成了562.99 Mb(contig N50 = 34.10 Mb)的二倍体解析参考基因组,为另一个二倍体(hap2)生成了561.07 Mb(contig N50 = 33.91 Mb)的二倍体解析参考基因组。原创 2024-04-26 15:05:47 · 919 阅读 · 0 评论 -
linux后台运行及任务挂后台-linux亲测有效操作001
命令用法说明jobsjobs -l查看任务详情pid等bgbg %工作ID将工作ID任务调入后台运行fgfg %工作ID将工作ID任务调入前台运行killkill -n [ PID | %工作ID ]向任务发送信号将任务立即放入后台运行nohup忽视 SIGHUP 信号disownordisown %1忽视 SIGHUP 信号亲测disown %1有效哈,可以下班了!下班啦!原创 2024-04-06 20:25:45 · 923 阅读 · 0 评论