PHI注释步骤(含批量)

https://www.sciencedirect.com/science/article/pii/S1878614620300015?via%3Dihub

BLASTP was run using NCBI-BLAST-2.7.1+ (Camacho et al., 2009) against fungal sequences in the UniProt database, against the PHI database version 45 (Urban et al., 2017), and against the MEROPS release 12.0 database (Rawlings et al., 2018).

17.PHI病原与宿主互作数据库

将PHI数据库下载下来本地blast,需要先填资料,填完之后即可下载至本地,使用blast进行比对。

PHI-base :: Pathogen Host Interactions

# 下载好的PHI数据库位置如下
/media/aa/DATA/SZQ2/PHI/PHI.fasta
# 在(pfam_scan)下
conda activate pfam_scan
# 新建文件夹
mkdir 17.PHI && cd 17.PHI

根据下载好的PHI数据库,将需要查找的蛋白序列,与数据库进行BLASTP比对,命令如下:

1) diamond blastp

 evalue为1e-10

diamond blastp --db /media/aa/DATA/SZQ2/PHI/PHI.fasta --query /media/aa/DATA/SZQ2/bj/functional_annotation/pep70/$i.fasta --out $i.phi10.xml --outfmt 5 --sensitive --max-target-seqs 20 --evalue 1e-10 --id 20 --tmpdir /dev/shm --index-chunks 1

批量操作

批量 pep70

for i in `cat /media/aa/DATA/SZQ2/bj/functional_annotation/70list.txt`
do
    echo "diamond blastp --db /media/aa/DATA/SZQ2/PHI/PHI.fasta --query /media/aa/DATA/SZQ2/bj/functional_annotation/pep70/$i.fasta --out $i.phi10.xml --outfmt 5 --sensitive --max-target-seqs 20 --evalue 1e-10 --id 20 --tmpdir /dev/shm --index-chunks 1"
done > command.phi.list
ParaFly -c command.phi.list -CPU 48

批量 pepmy

for i in `cat /media/aa/DATA/SZQ2/bj/functional_annotation/pepmylist.txt`
do
    echo "diamond blastp --db /media/aa/DATA/SZQ2/PHI/PHI.fasta --query /media/aa/DATA/SZQ2/bj/functional_annotation/pepmy/$i.fasta --out $i.phi10.xml --outfmt 5 --sensitive --max-target-seqs 20 --evalue 1e-10 --id 20 --tmpdir /dev/shm --index-chunks 1"
done > command.phi.list
ParaFly -c command.phi.list -CPU 48

2)parsing_blast_result.pl

新建文件夹

mkdir phi10.tab && cd phi10.tab
/media/aa/DATA2/bin/parsing_blast_result.pl --evalue 1e-10 --HSP-num 1 --out-hit-confidence --suject-annotation ../$i.phi10.xml > $i.phi10.tab

批量操作

批量 pep70

for i in `cat /media/aa/DATA/SZQ2/bj/functional_annotation/70list.txt`
do
    echo "/media/aa/DATA2/bin/parsing_blast_result.pl --evalue 1e-10 --HSP-num 1 --out-hit-confidence --suject-annotation ../$i.phi10.xml > $i.phi10.tab"
done > command.phi.list
ParaFly -c command.phi.list -CPU 48

 批量 pepmy

for i in `cat /media/aa/DATA/SZQ2/bj/functional_annotation/pepmylist.txt`
do
    echo "/media/aa/DATA2/bin/parsing_blast_result.pl --evalue 1e-10 --HSP-num 1 --out-hit-confidence --suject-annotation ../$i.phi10.xml > $i.phi10.tab"
done > command.phi.list
ParaFly -c command.phi.list -CPU 48

Blast分析后的注释结果中一条序列含有多种结果,后续的分析需要提取得到基因最可能的注释结果。

如“/media/aa/DATA2/bin/gene_annotation_from_SwissProt.pl的操作,如下:

3比对结果中筛选每个query的最佳subject

# 在(jcvi)下
conda activate jcvi
python -m jcvi.formats.blast best -n 1 $i.phi10.tab

批量操作

批量 pep70

for i in `cat /media/aa/DATA/SZQ2/bj/functional_annotation/70list.txt`
do
    echo "python -m jcvi.formats.blast best -n 1 $i.phi10.tab"
done > command.jcvi.list
ParaFly -c command.jcvi.list -CPU 48

 批量 pepmy

for i in `cat /media/aa/DATA/SZQ2/bj/functional_annotation/pepmylist.txt`
do
    echo "python -m jcvi.formats.blast best -n 1 $i.phi10.tab"
done > command.jcvi.list
ParaFly -c command.jcvi.list -CPU 48

4)复制并重命名

# 新建文件夹
mkdir best && cd best
# 复制
cp ../*.tcdb10.tab.best ./

首先将denovo组装出来的基因组序列预测得到蛋白文件*pep,与数据库中的宿主库和病原库分别比对。如果某些序列的病原库比对得分更高,就将这些序列与PHI数据库进行比对,找出病原相关基因。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Usage: /home/chenlianfu/chenlianfu_scripts/parsing_blast_result.pl [options] blast.out > blast.tab 对BLAST的xml或tab格式的结果进行解析和过滤,得到更准确的BLAST结果。结果为表格形式(BLAST outfmt6),结果按query序列的ID排序,每个query序列的比对结果按得分排序。 --type default: xml 设置输入BLAST结果文件的类型。可以设置为xml或tab两种类型。 若是tab格式,则BLAST结果中没有query与subject的序列长度信息,默认设置下无法使用--subject-coverage和--query-coverage参数的覆盖率阈值对结果进行过滤。在设置--db-subject输入数据库FASTA文件后可以使用--subject-coverage参数进行过滤;在设置--db-query输入query序列FASTA文件后可以使用--query-coverage参数进行过滤。 若是xml格式,结果文件中包query和subject长度信息,从而不需要使用--db-subject和--db-query参数输入FASTA序列文件。 --no-header 添加该参数则不输出表头。 --max-hit-num default: 20 设置允许的最大hit数量。 --evalue default: 1e-5 设置HSP的evalue阈值。 --identity default: 0.05 设置HSP的identity阈值。 --CIP default: 0.2 设置cumulative identity percentage阈值(这里依然使用了比值,单位不是%,所以其值要设置不大于1,默认值0.2表示20%阈值),对Hit进行过滤。CIP = 所有HSPs的一致位点之和 / 所有HSPs的比对长度之和。 --subject-coverage default: 0.2 设置所有HSPs对subject序列总体的覆盖率阈值。该参数阈值在文献中也被称为CALP(cumulative alignment length percentage),即 sum of all HSPs / subject length。 --db-subject 输入数据库的FASTA文件,以获取subject序列长度信息。 --query-coverage default: 0.2 设置所有HSPs对query序列总体的覆盖率阈值。该参数阈值在文献中也被称为CALP(cumulative alignment length percentage),即 sum of all HSPs / query length。 --db-query 输入query序列的FASTA文件,以获取query序列长度信息。 --percentage-of-top-bitscore default: 100 使用bitscore得分对hit进行过滤,设置输出hits的bitscore得分和最高得分相差不超过最高得分的百分数。hit若有多个HSPs,则取最高的HSP得分作为hit的得分;若数据库非常大,则推荐将设置该参数值设置为10,则能极大减少比对结果,保留最准确的结果;若数据库比较小,则推荐设置该参数值为50,或使用默认值;使用该参数来减少比对结果,优于仅使用最优比对结果。 --HSP-num default: max 若一个hit有多个HSPs,该参数设置输出得分指定数目个最高的HSPs。默认输出所有的HSPs。 --out-hit-confidence 添加该参数,则在表格结果第13、14和15列分别输出Hit的CIP、CALP_query、CALP_subject值。 --suject-annotation 若--type参数的值是xml,添加该参数可以生效,则额外增加最后一列suject annotation注释结果。
Phi Kappa 旋转矩阵是一种常用的数学工具,用于描述平面或三维空间中的旋转变换。它是由一个二维或三维的正交矩阵表示的,该矩阵可以通过沿着某个轴旋转一定的角度来实现旋转操作。 Phi Kappa 旋转矩阵可以用来解决许多几何和物理问题。在计算机图形学中,它被广泛应用于三维模型的变换和渲染,通过将模型和相机进行旋转变换,可以实现视图的切换和场景的渲染。此外,在物理学中,Phi Kappa 旋转矩阵也可以用于描述刚体的旋转运动。 Phi Kappa 旋转矩阵具有多个特性和性质。其中一个重要的性质是它们是正交矩阵,即其转置等于其逆。这个特性保证了旋转操作的保持长度和角度不变,使得Phi Kappa 旋转矩阵可以作为无失真旋转的理想工具。 另一个重要的特性是Phi Kappa 旋转矩阵可以通过将旋转轴上的单位向量与旋转角度相乘来计算。这意味着我们可以通过指定旋转轴和旋转角度来构造一个Phi Kappa 旋转矩阵。例如,在二维空间中,我们可以通过将x轴上的单位向量与角度θ相乘得到一个2x2的Phi Kappa 旋转矩阵。 总的来说,Phi Kappa 旋转矩阵是一个重要的数学工具,用于描述和实现平面或三维空间中的旋转变换。它具有保持长度和角度不变的性质,可以通过指定旋转轴和旋转角度来构造。在计算机图形学和物理学等领域中,Phi Kappa 旋转矩阵有着广泛的应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值