WGS分析-你的测序数据完整吗?

我们在拿到重测序, 转录组测序等组学数据之后,首先要检查数据完整性

这里就需要 cue 到 MD5,它是一种信息摘要算法,一种被广泛使用的密码散列函数,可以产生出一个128位(16字节)的散列值,用于确保信息传输完整一致。

它由美国密码学家罗纳德·李维斯特设计,于1992年公开,用以取代MD4算法。算法步骤分为五步:按位补充数据、扩展长度、初始化MD缓存器、处理数据段、输出。由于MD5算法具有普遍、稳定、快速的特点,仍广泛应用于普通数据的加密保护领域,如密码管理、电子签名、垃圾邮件筛选等。

简单点,就是,md5 可以为每个文件生成独特的 ID,只有完全相同的文件,md5 才会一致

因此,测序公司交付测序数据的时候,或者我们下载一些公共数据的时候,一般会提供文件的 md5 值。所以我们拿到数据后,第一步需要对数据进行 md5 数值校验

进入正题–校验MD5常用软件

1) MD5Check windows/linux
2) md5sum linux
引用来源
测序数据文件中MD5是个啥 ?不要无视我的存在!https://www.omicsclass.com/article/846
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值