求GC含量(弱智法)

linux(或者用R里的linux命令行)

for file in seq2/*.fq.gz; do
filename=$(basename "$file" .fq.gz)
avg_gc=$(seqkit fx2tab $file -g --name | awk '{sum+=$2; count++} END {print sum/count}')
echo -e "$filename\t$avg_gc" > "output2/$filename.txt"
done

合并

cat output2/*.txt > combined_GC.txt


求一个样品的平均(R语言)

# 加载所需的库
library(dplyr)

# 读取数据文件
data <- read.table("combined_GC.txt", header = FALSE, sep = "\t", stringsAsFactors = FALSE)

# 提取前缀信息
data$prefix <- sub("_.*", "", data$V1)

# 按前缀分组,计算平均值
result <- data %>%
  group_by(prefix) %>%
  summarise_at(2, mean)

result$prefix <- sub("-.*", "", result$prefix)

# 将结果写入新文件
write.table(result, file = "combined_GC_output.txt", sep = "\t", row.names = FALSE, col.names = TRUE)

  • 8
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值