具体课题中学习记录

这篇博客介绍了在Linux环境中使用Linuxnd进行数据下载,包括断点续传功能。同时,讲解了如何将数据上传到集群/public/目录,并提供了查看数据来源平台的方法,涉及测序平台的识别。博主还分享了遇到的qsub命令使用误区,强调了主节点与子节点的关系。此外,提到了cutadapt工具的剪切原理。
摘要由CSDN通过智能技术生成

1. Linuxnd 诺禾数据下载

Linuxnd
第一次用的windows软件,下次把Linuxnd装上下载,还可以断点续传。

2. 将数据上传至集群/public/中

1.上传方法
2.tips:

1)可以直接把数据传到public下面,需要跑数据的时候写对路径调用即可。

3. 如何查看自己的数据来自哪个平台

why:知道了自己的数据来自哪个平台,才可以知道自己的数据特征,如adaptor,
示例:

@HWI-ST1327:30:C18RRACXX:8:1101:10939:1992 1:N:0:ACCAAT
AGGACCCGAAAGATGGTGATGGAATTCTCGGGTGCCAAGGAACTCCAGTC
+
DDFFFHHHHHJIIIJJHIHIJJJJIJIIJJJJDGHIJJJJIJJJJJJJIJ
  1. 根据fastq文件的第一行开头的标识来判断自己的数据来源
  2. 编号及其对应的illumina平台
    在这里插入图片描述
  3. 特殊编号
    当仅通过第一行第一个冒号前的编号无法对照表格判断自己的数据来源时,需要看到后面的C18RRACXX("CCGERANXX"这9个字符组成的FCID)这一部分,根据illumina_instrument.py中的内容做进一步判断。通过illumina instrument.py中的文件,可以将测序平台范围缩小,然后有时会出现依旧需要在多个平台中做出筛选的情况,此时,再根据读长进行筛选。
    在这里插入图片描述
  4. NovaSeq :AXXXXX

Reference:illumina测序平台参考
illumina测序平台判断

4.illumina测序什么时候会测到接头?

总的来说就是读长大于插入片段时

5. qsub由提交命令到子节点的问题

  1. 大坑!!!
    我找到原因了,是在主节点输入qsub命令,并且定义要提交的节点,把脚本投射给子节点。不是从子节点运行qsub命令去调用主节点的脚本。我最开始看的那个示例不知道为什么没有定义子节点,我就默认是在子节点输入qsub命令了

  2. 集群只能由主节点向子节点提交命令,所以在子节点显示当前host是不可提交的host

  3. qsub命令

    ##投递任务
    qsub -cwd -l vf=*G,p=n,h=node -q queue *.sh
    
  4. 我的命令及需要关注的格式问题
    在这里插入图片描述
    集群的使用——将脚本多的程序放在子节点中运行

  5. 我觉得我犯这个错误最根本的原因的对于linux的硬件结构没有一个概念,就像root拥有所有权限,而底下的用户只能对自己的文件进行处理;同理,主节点也是那个拥有最大权力的节点,这些计算字节点都是小喽啰,是听命于主节点的!!!

在这里插入图片描述

6. cutadapt 用法及原理

具体剪切方式

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值