小余吐泡泡-CSDN博客

原创关于多重扩增引物设计Tm值范围设置的问题的思考

有的时候可以逆向思考一下，别人的文献有的是会报道一些多重扩增的引物序列的，仔细查一查总会有收获。直接看看人家是怎么样的数据范围，是不是就可以呢？是不是反过来，也可以认为：多重扩增的不同引物的Tm值范围没有必要设置的很小？这么一看，Tm值从62.67至69.76不等，范围差别还蛮大。没有结论的结论：实践出真章，或者条条大路通罗马。

2025-11-19 20:02:01 91

网上随便搜索一下，有很多设计原则，包括Tm值选择合理、GC含量合理、引物之间不产生引物二聚体、引物长度范围设置、产物长度范围设置，需要面面俱到。既要引物能特异性扩增，又要扩增速度比较接近，还要在一个扩增体系内完成。最容易想到的就是调整引物浓度，比如那个片段扩增的少了，就把这对引物多加点。结合两轮扩增建库策略，是相对容易对多位点SNP、多外显子、特定区域序列进行扩增+建库+NGS测序的。简单粗暴，也许就是最有用的。但是，多重扩增技术也是有一些门槛的，今天主要梳理一下门槛有哪些（俗称挖坑，后面慢慢填）。

2025-11-15 11:21:32 233

原创 python写了个猜拳的游戏

#/usr/bin/python# -*- coding: utf-8 -*-import randomprint('***欢迎开始猜拳游戏***')while True: player = int(input('请出拳：0--剪刀;1--石头;2--布\n')) if player == 0: print('您出了剪刀') elif player == 1: print('您出了石头') elif player == 2: print('您出了布') while (playe

2020-09-03 20:29:50 298

原创 perl代码匹配fastq文件内特定格式的序列并统计

#!/usr/bin/perluse strict;use warnings;my $seq;my $bar;my %hash;open IN,$ARGV[0] || die $!;open OUT,">$ARGV[1]" || die $!;while (<IN>) { chomp; my $id = $_; my $seq = <IN>; my $add = <IN>; my $qual = <IN>; if (

2020-08-19 20:34:58 648 1

原创 perl遍历文件夹并打印各个文件夹内fasta格式文件名称

#!/usr/bin/perluse strict;use warnings;my $path =`pwd`;my @DIR;my $dir;chomp($path);opendir (IN,$path);@DIR=readdir IN;foreach $dir (@DIR) { unless ($dir =~/\./){ open (DIR,$dir); chdir ("$dir/"); my @file = glob "*.fasta"; print "

2020-08-16 18:47:45 352

原创 perl代码提取genebank文件中最后部分的fasta序列

#!/usr/bin/perluse strict;use warnings;my $id;my $seq;open IN,$ARGV[0] or die "Can't open genebank file!";while (<IN>) { chomp; if (/ACCESSION/) { my @infor = split (/\s+/,$_); $id = $infor[1]; print ">$id\n"; } if (/\s+\d+\s[ATG

2020-08-11 20:44:40 676

原创 perl代码实现fasta序列多行转一行

有的时候，很多fasta文件是这个样子的：但是，有些软件或者程序只能是一行id，一行序列的读取。这就要求我们需要将上述格式序列多行转一行。下面这段代码可以解决上述问题。#!/usr/bin/perluse strict;use warnings;my $id;my $seq;open IN,"$ARGV[0]" or die "Can't open fasta file!";local $/ = ">";<IN>;##第一个">"过掉while (<I

2020-08-10 20:11:37 1403 1

原创 PacBio和NanoPore两种三代测序仪的比较

可以这么说，目前在长度长的三代测序领域内，基本上是PacBio和Nanopore的天下。二者测序技术各有千秋，我就来谈一点浅薄的认识。首先，介绍一下二者的测序原理。PacBio采用SMRT测序技术，名称取自single molecule real time sequencing，即单分子实时测序。上图为PacBio的核心测序原理，基本上包括以下几个要点：制造出一个ZMW孔（Zero-Mode Waveguides），一个光学物理概念。大白话说，就是在这个孔底部照射激光，这些光不会穿透小孔。这样每

2020-08-09 16:30:28 45378

原创 perl代码实现fastq转fasta

#!/usr/bin/perluse strict;use warnings;my $id;my $seq;open IN,"$ARGV[0]" or die $!;while (<IN>) { chomp; $id = $_; $seq = <IN>; my $add = <IN>; my $qual = <IN>; print ">$id\n$seq\n";}close IN;

2020-08-04 21:16:25 617

原创 perl代码实现fasta序列GC含量从高到低排序

#!/usr/bin/perluse strict;use warnings;my $gc;my $gc_ratio = 0;my $id ="";my %hash;local $/ = "\n>";open IN,"$ARGV[0]" or die "Can't open fasta file!";while (<IN>) { s/>//g; my($id,$seq) = split /\n/,$_,2; my $len = length $seq;

2020-08-03 20:55:35 334

原创 perl程序实现对fasta序列反向互补

#!/usr/bin/perluse strict;use warnings;open IN,"$ARGV[0]" or die "Can't open fasta file!";while (<IN>) { chomp; if (/>\S+/) { my $id = $_; print "$id\n"; }else{ my $seq = $_; my $rseq = rev_and_com($seq); print "$rseq"; }}su

2020-07-27 20:36:20 1165

原创 perl程序执行查找指定id的fasta序列

本程序用于查找指定序列id的fasta序列，基本思路就是将需要查找的fasta文件序列id存入一个哈希，然后遍历目标fasta文件，进行查找。#!/usr/bin/perluse strict;use warnings;my $target_ids;my %id;my $num;open IN1,$ARGV[0] || die $!;##目标id文件open OUT,">$ARGV[2]" || die $!;##输出文件名称while (<IN1>) { chomp

2020-07-26 20:02:56 888 3

原创 perl代码实现DNA翻译蛋白序列

#!/usr/bin/perl##本代码用于逐条翻译fasta序列至蛋白序列，指定了起始密码子和终止密码子use strict;use warnings;my %hash;my $id;my $seq;open FA,"$ARGV[0]" or die "Can't open fasta file!";while (<FA>) { chomp; if (/^>(\S+)/) { $id = $1; }else{ $seq = $_; $hash{$id}

2020-07-21 20:53:07 1340

原创检测DNA插入片段位置的Guide-seq实验方案

问题是，如果一段DNA插入基因组某个或者某些位置了，但是我们不知道其具体位置，希望通过测序的方法来检测这些位置信息。最简单直接的办法当然是全基因组测序（最好还要是长度长的三代测序的），然后比对插入基因序列，找边缘序列（类似于嵌合体，一半是插入的基因序列，一半是基因组的序列）。但是这个办法相对来说成本比较高。那有没有相对简单的办法呢？答案当然是有的，就是Guide-seq。其基本原理如下图所示：图片出自Illumina官网简述该流程步骤如下：准备好加入dsODN的细胞样本或DNA样本，按照常规文

2020-07-18 21:24:38 51343

原创 NGS测序结果中duplicate序列问题的理解

首先，我们先来了解一下，什么是duplicate序列。大白话说，就是高通量测序结果中那些一模一样的序列。它们产生的原因有多种可能，以下图为例：图片来自网络其中，最好理解的原因就是PCR。因为一个DNA分子经过扩增之后，得到很多个一模一样的DNA产物。这些产物可能有2个及以上被测序了，这样就得到了重复序列。看到这里，大家可能还会有疑问。难道高通量测序得到一模一样的序列不正常吗？嗯，测到这样一模一样的序列当然是正常现象，毕竟测序的时候要做桥式PCR，建库

2020-07-15 21:56:09 7820

原创 illumina平台的一些扩增子测序项目介绍

扩增子测序其实就是PCR产物测序，只是PCR技术变种特别多，所以就统称为扩增子测序吧。另外，通俗的说，高通量测序技术其实就是一次可以测很多不一样DNA序列的技术。当PCR技术和高通量测序技术结合起来，就可以解决很多实际研究中的问题。当然，也不是完全没有限制，主要限制因素是读长和碱基平衡问题。下面我们就来罗列一下各种扩增子测序类型。1.16s/18s/ITS等标记基因可变区检测其实验原理图如下：实验过程主要是2步PCR，第一步，特异性引物和部分接头引物合并后扩增，得到一个目标基因的混合产物。原因是模板

2020-07-14 20:53:05 5730

原创 perl统计各个fasta序列长度及其出现次数

#!/usr/bin/perluse strict;use warnings;my $seq;my %hash;my $id;my $length;##读取句柄，input为标准fasta数据格式，即一行id,一行序列open IN,"$ARGV[0]" or die $!;##输出文件名已经固定open OUT,">Read_stats.txt" or die $!;while (<IN>) { chomp; if (/^>\S+/) { my $

2020-07-13 21:18:53 1411

原创一个简单的Perl脚本求单条序列的GC含量

#!/usr/bin/perluse strict;use warnings;##初学Perl，代码比较简单，其实还有更简单的解决办法，请勿拍砖my $str = "ACGTACGTACGT";##$str为目标序列，即计算该序列的GC%my @lines = split //,$str;##将目标序列分割成单个碱基，并将单个碱基存入数组my($num_A,$num_G,$num_C,$num_T) = (0,0,0,0);初始化各种碱基的值，起始值为0foreach my $char

2020-07-12 20:07:35 772

原创全外显子捕获测序的杂交和封闭原理

做外显子捕获测序实验时，会用到Cot DNA，blocker(封闭接头序列)，探针（DNA/RNA均可），链霉素磁珠等，它们具体起什么作用呢？下面，我们就来聊聊这个问题。就实验原理来讲，外显子捕获测序的基本流程是：1.先对各个样品独立构建常规测序文库；2：等摩尔比例混合各个待杂交的文库；3：在杂交缓冲液体系内加入文库、杂交探针、Cot DNA、Blocker等；4.加入链霉素磁珠抓取杂交复合状态DNA；5：在洗脱缓冲液中洗脱目标文库，并扩增。下图是正常建好的文库示意图。大家都知道，DNA是双链互补配

2020-07-09 21:15:14 12494

原创 NGS测序嵌合体是个需要去除的错误扩增序列

嵌合体（chirmas）是指一个PCR产物来自2个甚至更多模板分子，产生的原因被认为是延伸未完全导致的（chimeras might be created due to incomplete extension，参考文献：Reducing chimera formation during PCR amplification to ensure accurate genotyping）。尤其是在模板分子高度相似的情况下，嵌合体比例会升高许多。其形成的原理图基本如下图所示：图片来自网络另外，在illumi

2020-07-08 20:14:15 3372

原创 illumina测序的一些注意事项

illumina测序的一些注意事项在二代测序领域，illumina测序平台以其核心的三项技术（分别是碱基末端可逆修饰、桥式PCR和边合成变测序策略），独步天下。充分发挥了其碱基读取精确、通量提高、测序长度也稳步提高至双末端各300bp。但是，任何测序技术面对各种测序需求总是会有些许不足，大白话说就是：没有哪项技术可以解决全部的问题。那么，illumina测序有哪些问题是需要注意的呢？我们就来聊聊这个话题。问题一、测序过程中必须碱基平衡所谓碱基平衡，是指，测序芯片上完成成簇反应之后，一定面积内的不同分子

2020-07-07 20:10:36 6273

原创为什么要使用UDI for Illumina接头？

在回答文章标题问题之前，我们需要先了解一个现象，index-hopping，即标签跳跃或者错配。下图就是一种index-hopping产生的过程：上述图片展示的就是一种可能导致数据错误分配的情况，其前提是1号样品的index组合在2号样品中也可能出现。实际上illumina后续HiSeq4000,NovaSeq6000机器在测序桥式PCR过程中，如果有建库残留的index扩增引物，也可能产生index hopping现象。大致了解了什么是标签跳跃现象之后，我们再来解释一下什么是UDI接头。所谓UD

2020-07-06 20:16:28 4220

原创 illumina平台的测序接头

Illumina作为当今二代测序市场占比份额最大的测序平台，理解其测序接头的具体结构，有助于我们了解各种建库方法。下面，我就来介绍一下illumina的接头结构以及基于此衍生出的设计模式。Y型接头最常规的illumina接头就是俗称Y字形的接头，其结构如下：备注：图片来自网络如上图所示，红色和浅绿色的是固定序列，作用是成簇反应（桥式PCR的引物），使得文库DNA分子经过桥式PCR可以“长”到测序芯片上面，因此它的序列是固定的，也称为P5、P7序列，建好的文库使用这对引物扩增，可以起到放大文库量的作

2020-07-05 17:10:15 18277 2

ncyujijian的博客