求GC含量（弱智法）

江有枫xx

于 2024-05-11 13:55:14 发布

阅读量193

点赞数 8

文章标签： java 前端数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/youfeng_xjy/article/details/138712946

版权

linux（或者用R里的linux命令行）

for file in seq2/*.fq.gz; do
filename=$(basename "$file" .fq.gz)
avg_gc=$(seqkit fx2tab $file -g --name | awk '{sum+=$2; count++} END {print sum/count}')
echo -e "$filename\t$avg_gc" > "output2/$filename.txt"
done

合并

cat output2/*.txt > combined_GC.txt

求一个样品的平均(R语言）

# 加载所需的库
library(dplyr)

# 读取数据文件
data <- read.table("combined_GC.txt", header = FALSE, sep = "\t", stringsAsFactors = FALSE)

# 提取前缀信息
data$prefix <- sub("_.*", "", data$V1)

# 按前缀分组，计算平均值
result <- data %>%
group_by(prefix) %>%
summarise_at(2, mean)

result$prefix <- sub("-.*", "", result$prefix)

# 将结果写入新文件
write.table(result, file = "combined_GC_output.txt", sep = "\t", row.names = FALSE, col.names = TRUE)

关注

8
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
求GC含量（弱智法）

按前缀分组，计算平均值。# 将结果写入新文件。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。