自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 python写了个猜拳的游戏

#/usr/bin/python# -*- coding: utf-8 -*-import randomprint('***欢迎开始猜拳游戏***')while True: player = int(input('请出拳:0--剪刀;1--石头;2--布\n')) if player == 0: print('您出了剪刀') elif player == 1: print('您出了石头') elif player == 2: print('您出了布') while (playe

2020-09-03 20:29:50 241

原创 perl代码匹配fastq文件内特定格式的序列并统计

#!/usr/bin/perluse strict;use warnings;my $seq;my $bar;my %hash;open IN,$ARGV[0] || die $!;open OUT,">$ARGV[1]" || die $!;while (<IN>) { chomp; my $id = $_; my $seq = <IN>; my $add = <IN>; my $qual = <IN>; if (

2020-08-19 20:34:58 572 1

原创 perl遍历文件夹并打印各个文件夹内fasta格式文件名称

#!/usr/bin/perluse strict;use warnings;my $path =`pwd`;my @DIR;my $dir;chomp($path);opendir (IN,$path);@DIR=readdir IN;foreach $dir (@DIR) { unless ($dir =~/\./){ open (DIR,$dir); chdir ("$dir/"); my @file = glob "*.fasta"; print "

2020-08-16 18:47:45 294

原创 perl代码提取genebank文件中最后部分的fasta序列

#!/usr/bin/perluse strict;use warnings;my $id;my $seq;open IN,$ARGV[0] or die "Can't open genebank file!";while (<IN>) { chomp; if (/ACCESSION/) { my @infor = split (/\s+/,$_); $id = $infor[1]; print ">$id\n"; } if (/\s+\d+\s[ATG

2020-08-11 20:44:40 596

原创 perl代码实现fasta序列多行转一行

有的时候,很多fasta文件是这个样子的:但是,有些软件或者程序只能是一行id,一行序列的读取。这就要求我们需要将上述格式序列多行转一行。下面这段代码可以解决上述问题。#!/usr/bin/perluse strict;use warnings;my $id;my $seq;open IN,"$ARGV[0]" or die "Can't open fasta file!";local $/ = ">";<IN>;##第一个">"过掉while (<I

2020-08-10 20:11:37 1282 1

原创 PacBio和NanoPore两种三代测序仪的比较

可以这么说,目前在长度长的三代测序领域内,基本上是PacBio和Nanopore的天下。二者测序技术各有千秋,我就来谈一点浅薄的认识。首先,介绍一下二者的测序原理。PacBio采用SMRT测序技术,名称取自single molecule real time sequencing,即单分子实时测序。上图为PacBio的核心测序原理,基本上包括以下几个要点:制造出一个ZMW孔(Zero-Mode Waveguides),一个光学物理概念。大白话说,就是在这个孔底部照射激光,这些光不会穿透小孔。这样每

2020-08-09 16:30:28 43476

原创 perl代码实现fastq转fasta

#!/usr/bin/perluse strict;use warnings;my $id;my $seq;open IN,"$ARGV[0]" or die $!;while (<IN>) { chomp; $id = $_; $seq = <IN>; my $add = <IN>; my $qual = <IN>; print ">$id\n$seq\n";}close IN;

2020-08-04 21:16:25 551

原创 perl代码实现fasta序列GC含量从高到低排序

#!/usr/bin/perluse strict;use warnings;my $gc;my $gc_ratio = 0;my $id ="";my %hash;local $/ = "\n>";open IN,"$ARGV[0]" or die "Can't open fasta file!";while (<IN>) { s/>//g; my($id,$seq) = split /\n/,$_,2; my $len = length $seq;

2020-08-03 20:55:35 279

原创 perl程序实现对fasta序列反向互补

#!/usr/bin/perluse strict;use warnings;open IN,"$ARGV[0]" or die "Can't open fasta file!";while (<IN>) { chomp; if (/>\S+/) { my $id = $_; print "$id\n"; }else{ my $seq = $_; my $rseq = rev_and_com($seq); print "$rseq"; }}su

2020-07-27 20:36:20 1056

原创 perl程序执行查找指定id的fasta序列

本程序用于查找指定序列id的fasta序列,基本思路就是将需要查找的fasta文件序列id存入一个哈希,然后遍历目标fasta文件,进行查找。#!/usr/bin/perluse strict;use warnings;my $target_ids;my %id;my $num;open IN1,$ARGV[0] || die $!;##目标id文件open OUT,">$ARGV[2]" || die $!;##输出文件名称while (<IN1>) { chomp

2020-07-26 20:02:56 808 3

原创 perl代码实现DNA翻译蛋白序列

#!/usr/bin/perl##本代码用于逐条翻译fasta序列至蛋白序列,指定了起始密码子和终止密码子use strict;use warnings;my %hash;my $id;my $seq;open FA,"$ARGV[0]" or die "Can't open fasta file!";while (<FA>) { chomp; if (/^>(\S+)/) { $id = $1; }else{ $seq = $_; $hash{$id}

2020-07-21 20:53:07 1138

原创 检测DNA插入片段位置的Guide-seq实验方案

问题是,如果一段DNA插入基因组某个或者某些位置了,但是我们不知道其具体位置,希望通过测序的方法来检测这些位置信息。最简单直接的办法当然是全基因组测序(最好还要是长度长的三代测序的),然后比对插入基因序列,找边缘序列(类似于嵌合体,一半是插入的基因序列,一半是基因组的序列)。但是这个办法相对来说成本比较高。那有没有相对简单的办法呢?答案当然是有的,就是Guide-seq。其基本原理如下图所示:图片出自Illumina官网简述该流程步骤如下:准备好加入dsODN的细胞样本或DNA样本,按照常规文

2020-07-18 21:24:38 50120

原创 NGS测序结果中duplicate序列问题的理解

首先,我们先来了解一下,什么是duplicate序列。大白话说,就是高通量测序结果中那些一模一样的序列。它们产生的原因有多种可能,以下图为例: 图片来自网络其中,最好理解的原因就是PCR。因为一个DNA分子经过扩增之后,得到很多个一模一样的DNA产物。这些产物可能有2个及以上被测序了,这样就得到了重复序列。看到这里,大家可能还会有疑问。难道高通量测序得到一模一样的序列不正常吗?嗯,测到这样一模一样的序列当然是正常现象,毕竟测序的时候要做桥式PCR,建库

2020-07-15 21:56:09 7126

原创 illumina平台的一些扩增子测序项目介绍

扩增子测序其实就是PCR产物测序,只是PCR技术变种特别多,所以就统称为扩增子测序吧。另外,通俗的说,高通量测序技术其实就是一次可以测很多不一样DNA序列的技术。当PCR技术和高通量测序技术结合起来,就可以解决很多实际研究中的问题。当然,也不是完全没有限制,主要限制因素是读长和碱基平衡问题。下面我们就来罗列一下各种扩增子测序类型。1.16s/18s/ITS等标记基因可变区检测其实验原理图如下:实验过程主要是2步PCR,第一步,特异性引物和部分接头引物合并后扩增,得到一个目标基因的混合产物。原因是模板

2020-07-14 20:53:05 5411

原创 perl统计各个fasta序列长度及其出现次数

#!/usr/bin/perluse strict;use warnings;my $seq;my %hash;my $id;my $length;##读取句柄,input为标准fasta数据格式,即一行id,一行序列open IN,"$ARGV[0]" or die $!;##输出文件名已经固定open OUT,">Read_stats.txt" or die $!;while (<IN>) { chomp; if (/^>\S+/) { my $

2020-07-13 21:18:53 1320

原创 一个简单的Perl脚本求单条序列的GC含量

#!/usr/bin/perluse strict;use warnings;##初学Perl,代码比较简单,其实还有更简单的解决办法,请勿拍砖my $str = "ACGTACGTACGT";##$str为目标序列,即计算该序列的GC%my @lines = split //,$str;##将目标序列分割成单个碱基,并将单个碱基存入数组my($num_A,$num_G,$num_C,$num_T) = (0,0,0,0);初始化各种碱基的值,起始值为0foreach my $char

2020-07-12 20:07:35 685

原创 全外显子捕获测序的杂交和封闭原理

做外显子捕获测序实验时,会用到Cot DNA,blocker(封闭接头序列),探针(DNA/RNA均可),链霉素磁珠等,它们具体起什么作用呢?下面,我们就来聊聊这个问题。就实验原理来讲,外显子捕获测序的基本流程是:1.先对各个样品独立构建常规测序文库;2:等摩尔比例混合各个待杂交的文库;3:在杂交缓冲液体系内加入文库、杂交探针、Cot DNA、Blocker等;4.加入链霉素磁珠抓取杂交复合状态DNA;5:在洗脱缓冲液中洗脱目标文库,并扩增。下图是正常建好的文库示意图。大家都知道,DNA是双链互补配

2020-07-09 21:15:14 11569

原创 NGS测序嵌合体是个需要去除的错误扩增序列

嵌合体(chirmas)是指一个PCR产物来自2个甚至更多模板分子,产生的原因被认为是延伸未完全导致的(chimeras might be created due to incomplete extension,参考文献:Reducing chimera formation during PCR amplification to ensure accurate genotyping)。尤其是在模板分子高度相似的情况下,嵌合体比例会升高许多。其形成的原理图基本如下图所示:图片来自网络另外,在illumi

2020-07-08 20:14:15 2569

原创 illumina测序的一些注意事项

illumina测序的一些注意事项在二代测序领域,illumina测序平台以其核心的三项技术(分别是碱基末端可逆修饰、桥式PCR和边合成变测序策略),独步天下。充分发挥了其碱基读取精确、通量提高、测序长度也稳步提高至双末端各300bp。但是,任何测序技术面对各种测序需求总是会有些许不足,大白话说就是:没有哪项技术可以解决全部的问题。那么,illumina测序有哪些问题是需要注意的呢?我们就来聊聊这个话题。问题一、测序过程中必须碱基平衡所谓碱基平衡,是指,测序芯片上完成成簇反应之后,一定面积内的不同分子

2020-07-07 20:10:36 5589

原创 为什么要使用UDI for Illumina接头?

在回答文章标题问题之前,我们需要先了解一个现象,index-hopping,即标签跳跃或者错配。下图就是一种index-hopping产生的过程:上述图片展示的就是一种可能导致数据错误分配的情况,其前提是1号样品的index组合在2号样品中也可能出现。实际上illumina后续HiSeq4000,NovaSeq6000机器在测序桥式PCR过程中,如果有建库残留的index扩增引物,也可能产生index hopping现象。大致了解了什么是标签跳跃现象之后,我们再来解释一下什么是UDI接头。所谓UD

2020-07-06 20:16:28 3596

原创 illumina平台的测序接头

Illumina作为当今二代测序市场占比份额最大的测序平台,理解其测序接头的具体结构,有助于我们了解各种建库方法。下面,我就来介绍一下illumina的接头结构以及基于此衍生出的设计模式。Y型接头最常规的illumina接头就是俗称Y字形的接头,其结构如下:备注:图片来自网络如上图所示,红色和浅绿色的是固定序列,作用是成簇反应(桥式PCR的引物),使得文库DNA分子经过桥式PCR可以“长”到测序芯片上面,因此它的序列是固定的,也称为P5、P7序列,建好的文库使用这对引物扩增,可以起到放大文库量的作

2020-07-05 17:10:15 17021 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除