计算fasta文件中每条seq的GC含量代码(shell)

#!/bin/bash

# 检查是否提供了文件名
if [ $# -eq 0 ]; then
    echo "Usage: $0 <fasta_file>"
    exit 1
fi

# 读取FASTA文件名
fasta_file=$1

# 检查文件是否存在
if [ ! -f "$fasta_file" ]; then
    echo "File not found!"
    exit 1
fi

# 初始化变量
seq_name=""
seq=""

# 处理FASTA文件
while read -r line; do
    if [[ $line == ">"* ]]; then
        # 如果是新的序列名称,处理前一个序列
        if [ -n "$seq_name" ]; then
            gc_count=$(echo "$seq" | grep -o "[GCgc]" | wc -l)
            total_count=$(echo -n "$seq" | wc -c)
            gc_content=$(echo "scale=2; $gc_count * 100 / $total_count" | bc)
            echo "$seq_name GC Content: $gc_content%"
        fi
        # 设置新的序列名称和清空序列
        seq_name=$line
        seq=""
    else
        # 累加序列
        seq+=$line
    fi
done < "$fasta_file"

# 处理最后一个序列
if [ -n "$seq_name" ]; then
    gc_count=$(echo "$seq" | grep -o "[GCgc]" | wc -l)
    total_count=$(echo -n "$seq" | wc -c)
    gc_content=$(echo "scale=2; $gc_count * 100 / $total_count" | bc)
    echo "$seq_name GC Content: $gc_content%"
fi

用法:

./gc_content.sh your_fasta_file.fasta

输出:

>seq1 GC Content: 54.17%
>seq2 GC Content: 45.83%

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

终是蝶衣梦晓楼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值