实验记录 | 6/7 收一下尾巴

(8:53)到实验室。
首先,检查实验室服务器上是否有安装R。
在命令行中,敲入R

bash: R: command not found…

至少未被放入环境变量中。===>此路不通。

其次,将自己昨天安装编译好的R,移动到服务器中,看一下是否可行。
上传中(9:00),传输完成(9:18)。
./R

./R: line 240: /media/zxx/TOSHIBA/software/Rpackage/R-3.6.3/etc/ldpaths: No such file or directory
ERROR: R_HOME (’/media/zxx/TOSHIBA/software/Rpackage/R-3.6.3’) not found

由此可见,存在系统的依赖。所以,这种移植方式还是不行。===>此路不通。

最后,将源文件移动到服务器中,按照昨天的方法,在服务器中,重新安装R(我想还是会不可避免的遇到那个问题吧,如果再次遇到的话,必须要面对以及解决了)。(9:25)

tar -xzvf R-3.6.3.tar.gz
cd R-3.6.3/
./configure

遇到了warning:

configure: WARNING: neither inconsolata.sty nor zi4.sty found: PDF vignettes and package manuals will not be rendered optimally

暂时忽略。
make成功。
然后,切入R指令。
./R

R version 3.6.3 (2020-02-29) – “Holding the Windsock”
Copyright © 2020 The R Foundation for Statistical Computing
Platform: x86_64-pc-linux-gnu (64-bit)
R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under certain conditions.
Type ‘license()’ or ‘licence()’ for distribution details.
Natural language support but running in an English locale
R is a collaborative project with many contributors.
Type ‘contributors()’ for more information and
‘citation()’ on how to cite R or R packages in publications.
Type ‘demo()’ for some demos, ‘help()’ for on-line help, or
‘help.start()’ for an HTML browser interface to help.
Type ‘q()’ to quit R.

成功安装了R版本。
install.packages("statmod")
library(statmod)
意料之外的顺利。

所以,到这里,这个包的问题,也解决了。
接下来,修改somtatic.pl中的R路径,即可。


运行过一遍之后,出现了这样的问题:
/home/xxzhang/software/R/R-3.6.3/bin/Rscript /home/xxzhang/workplace/QBRC//somatic_script/filter_vcf.R ./output NA

Can’t exec “/home/xxzhang/software/R/R-3.6.3/bin/Rscript”: No such file or directory at somatic.pl line 525.

所以,主要原因还是路径修改的不对。
我们的Rscript的位置在:

/home/xxzhang/workplace/software/R/R-3.6.3/bin/Rscript

重新修改。
回到window界面下。
修改完成(10:09)。


重新运行中(10:11)。
老师来了,有点紧张。

上一个问题解决,又出现了新的问题。
/home/xxzhang/workplace/software/R/R-3.6.3/bin/Rscript /home/xxzhang/workplace/QBRC//somatic_script/filter_vcf.R ./output NA

Reading variants.vcf
Filtering strelka_germline tumor_only
Error in split_info[[i]] : subscript out of bounds
Calls: filter_vcf -> t -> sapply -> lapply -> FUN -> strsplit
Execution halted

通过搜寻资料,我明白了。下标越线的意思就是说,当我把一个超出数组大小的矩阵,放入matrix时,就会出现这样的问题。
我来阅读一下,这串代码,看看他的输入和输出的文件,是什么?
我单独的运行一下这行代码行不行?
弄明白了,输入文件是上游calling产生的文件,variant.vcf。然后,使用这个R脚本来进行处理。奇怪的是,我打开这个步骤生成的R脚本看了一下,发现只有一行(且注释的染色体号是错误的):

#CHROM POS ID REF ALT QUAL FILTER INFO FORMAT tumor
chr1 564463 . A G 17 LowGQX;NoPassedVariantGTs SNVHPOL=4;MQ=21 GT:GQ:GQX:DP:DPF:AD:ADF:ADR:SB:FT:PL 1/1:7:7:3:0:0,3:0,3:0,0:0.0:LowGQX:54,9,0

类似于这种,只有一行。
所以,我猜测是前面的流程出了问题。以及,我一直想要弄明白,为什么我在GATK的流程中,生成的结果文件是空的?为什么?这一步骤的意义是什么?
在这里插入图片描述目前进展到了这里:
在这里插入图片描述coverage.txt文件中有内容:

#CHROM POS ID REF
chr1 564463 . A
chr1 564464 . G
chr1 564465 . G
……

而germline_mutations/somatic_mutations的结果文件,按理说应该是有内容的,但是除了log文件之外,并无结果。
说明,我前面的运行过程,还是有问题。
不要着急,这是我下一阶段,需要去解决的问题。

我需要去读一下这些代码文件。(11:50)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值