1. Linuxnd 诺禾数据下载
Linuxnd
第一次用的windows软件,下次把Linuxnd装上下载,还可以断点续传。
2. 将数据上传至集群/public/中
1.上传方法
2.tips:
1)可以直接把数据传到public下面,需要跑数据的时候写对路径调用即可。
3. 如何查看自己的数据来自哪个平台
why:知道了自己的数据来自哪个平台,才可以知道自己的数据特征,如adaptor,
示例:
@HWI-ST1327:30:C18RRACXX:8:1101:10939:1992 1:N:0:ACCAAT
AGGACCCGAAAGATGGTGATGGAATTCTCGGGTGCCAAGGAACTCCAGTC
+
DDFFFHHHHHJIIIJJHIHIJJJJIJIIJJJJDGHIJJJJIJJJJJJJIJ
- 根据fastq文件的第一行开头的标识来判断自己的数据来源
- 编号及其对应的illumina平台
- 特殊编号
当仅通过第一行第一个冒号前的编号无法对照表格判断自己的数据来源时,需要看到后面的C18RRACXX("CCGERANXX"这9个字符组成的FCID)这一部分,根据illumina_instrument.py中的内容做进一步判断。通过illumina instrument.py中的文件,可以将测序平台范围缩小,然后有时会出现依旧需要在多个平台中做出筛选的情况,此时,再根据读长进行筛选。
- NovaSeq :AXXXXX
Reference:illumina测序平台参考
illumina测序平台判断
4.illumina测序什么时候会测到接头?
5. qsub由提交命令到子节点的问题
-
大坑!!!
我找到原因了,是在主节点输入qsub命令,并且定义要提交的节点,把脚本投射给子节点。不是从子节点运行qsub命令去调用主节点的脚本。我最开始看的那个示例不知道为什么没有定义子节点,我就默认是在子节点输入qsub命令了 -
集群只能由主节点向子节点提交命令,所以在子节点显示当前host是不可提交的host
-
qsub命令
##投递任务 qsub -cwd -l vf=*G,p=n,h=node -q queue *.sh
-
我的命令及需要关注的格式问题
集群的使用——将脚本多的程序放在子节点中运行 -
我觉得我犯这个错误最根本的原因的对于linux的硬件结构没有一个概念,就像root拥有所有权限,而底下的用户只能对自己的文件进行处理;同理,主节点也是那个拥有最大权力的节点,这些计算字节点都是小喽啰,是听命于主节点的!!!