2021/03/22
这是一个小任务
读取某个目录下的文件
import os
aim_dir = '/home/user/fastq_dir/'
fastq_files = os.listdir(aim_dir)
print(fastq_files)
结果是一个列表,包括此目录下所有的文件的全称 及 文件扩展名(.txt,.fasta,.gz等)
for fastq_file in fastq_files:
print(fastq_file)
循环输出每一个文件名
若文件名格式一致,如为 sample_name.fastq.gz ,可使用 正则表达式 获取想要的信息
若目标目录 下不是文件而是文件夹,可循环上一步获取所需要文件夹内的内容
# 例如 文件范例为 /home/user/fastq_dir/sample_name/sample_name.fastq.gz
samples = os.listdir(aim_dir)
for sample in samples:
fastq_path = f'aim_dir{sample}/{sample}.fastq.gz'
随后可以处理 fastq.gz 文件
f'{sample}'可以填入变量,是形成一段固定格式的字符串,与 '{0}'.format(sample) 相同,但更简略一点
在Linux中:查看 .gz 压缩文件
查看 .gz 压缩文件
在Linux中:
less -S *.gz | grep 'keyword' | less -