![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
生物信息学
文章平均质量分 73
wangchuang2017
天下才子,中州过半
惟楚有才,于斯为盛
实事求是,知行合一
师者,所以传道,授业,解惑也
展开
-
PacBio第三代测序技术迎来创新性升级,准确度可与二代测序相媲美 | Nature Biotech
以PacBio、Oxford Nanopore为代表的第三代测序技术因测序读长较长,对于基因组中复杂区域尤其是复杂结构变异的研究具有得天独厚的优势,因此,该技术近些年备受科学界的青睐。此外,新方法有助于产生更加完整的基因组,以及分析所有基因区域的序列,包括短读长技术的低映射区域,且成本与当前的短读长测序相似。在DNA样本加载到测序仪之前就开始进行测序反应,经过几个小时的延伸,如果聚合酶还可以继续“工作”,研究人员就可以判断DNA没有受损,并选择性的将DNA加载到测序仪,进行长读长测序。同时,研究团队发现,原创 2023-03-13 20:01:46 · 1104 阅读 · 0 评论 -
consensus sequence和sequence motif有什么有什么区别?关注者8被浏览6,181
consensus sequence,既共有序列,是在一套相似序列中的每个位置上都由最常出现的残基所组成的DNA或氨基酸序列,决定启动序列的。consensus sequence 保守序列 可以应用在序列比对中,比如可以表示某个氨基酸或某几个氨基酸在进化中保守;sequence motif 序列motif 是基于统计的一段序列,比如可以表示某个转录因子在基因组上面结合位点的序列。sequence motif,既序列基序,可以定义为蛋白质(蛋白质序列)属于一个给定的蛋白质家族。原创 2023-08-18 20:12:35 · 242 阅读 · 0 评论 -
BWA,Bowtie,Bowtie2的比对算法推导
BWA,Bowtie,Bowtie2的比对算法推导原创 2022-06-05 21:20:59 · 1614 阅读 · 1 评论 -
1953年克里克和沃森发现DNA双螺旋结构
1953年克里克和沃森发现DNA双螺旋结构1953年,克里克(Francis Crick)和沃森(James D. Watson)发现DNA双螺旋结构。这一发现是分子生物学时代的开端。1962年,沃森、克里克和威尔金斯获得了诺贝尔医学及生理学奖。萨尔克(Jonas Salk)研究员研制出了小儿麻痹症(即脊髓灰质炎)疫苗。1953年,黑真(Elizabeth Lee Hazen) 和布朗(Rachel Fuller Brown)研制出第一种真菌抗生素——制霉菌素(NYSTATIN)。制霉菌素普遍用原创 2022-05-14 16:40:02 · 4944 阅读 · 0 评论 -
Genome assemblers
Genome assemblersList of genome assembly programs for PacBio long-read datasets. Not in any specific order :DSome of the assemblers are suitable also for ONT reads.Hifiasmhttps://github.com/chhylp123/hifiasmHifiasm is a fast haplotype-resolved de no原创 2022-03-29 20:58:57 · 516 阅读 · 0 评论 -
鸢尾花(iris)数据集
鸢尾花(iris)数据集更新时间:2021-03-21 01:01:09标签:数据集鸢尾花说明机器学习教程正在计划编写中,欢迎大家加微信 sinbam 提供意见、建议、纠错、催更。鸢【音:yuān】尾花(Iris)是单子叶百合目花卉,是一种比较常见的花,可能不经意间你就能在某个公园里碰见它,而且鸢尾花的品种较多。它是一个很小的数据集,仅有150行,5列。该数据集的四个特征属性的取值都是数值型的,他们具有相同的量纲,不需要你做任何标准化的处理,第五列为通过前面四列所确定的鸢尾花所属..原创 2022-03-24 22:11:04 · 25918 阅读 · 0 评论 -
PaSS:用于 PacBio 测序的测序模拟器
PaSS:用于 PacBio 测序的测序模拟器张文敏,1本佳,1魏朝春1,2作者信息文章注释版权和许可信息免责声明本文已被PMC 中的其他文章引用。相关数据补充材料数据可用性声明去:抽象的背景第三代测序平台,如 PacBio 测序,近年来发展迅速。PacBio 测序比第二代测序(或下一代测序,NGS)技术产生更长的读取,并且它具有独特的测序错误模式。有效的读取模拟器对于评估和促进用于 PacBio 测序数据分析的新生物信息...原创 2022-03-23 18:44:28 · 1587 阅读 · 0 评论 -
揭晓你所不了解的第三代测序技术
揭晓你所不了解的第三代测序技术浏览5440·讨论1biozy楼主发布于2015-07-10只看楼主什么是第三代测序技术?第三代测序技术是指单分子测序技术。DNA测序时,不需要经过PCR扩增,实现了对每一条DNA分子的单独测序。如果你还记得,我们之前说过二代测序之所以要进行PCR扩增是为了放大信号,而在第三代测序里,在没有进行PCR扩增的情况下,是怎样做到对碱基信号的识别的呢?本文为你揭晓。第三代测序技术原理第三代测序技术原理主...原创 2022-03-22 11:46:58 · 1320 阅读 · 0 评论 -
基因测序3——三、四代测序技术来势汹汹,国产化仍在布局二代测序?
基因测序3——三、四代测序技术来势汹汹,国产化仍在布局二代测序?和义广业创新平台为医械创新创业者提供一站式产业转化服务取消关注1 人赞同了该文章导读【行业分析】基因测序系列,将聚焦基因测序设备,系统分析一代、二代、三代基因测序设备的技术原理,代表厂家,仪器特点以及未来趋势。本篇介绍三、四代测序技术及对应设备特点,市场情况。同时分析国内对基因测序设备的探索现状及技术趋势。二代测序方兴未艾,三代、四代测序已然来势汹汹。全球的科研、产业乃至资本力量都将目光投向了基因测序技术。2原创 2022-03-22 11:43:06 · 3664 阅读 · 2 评论 -
人类基因测序被重新定义,时间减半创世界纪录
人类基因测序被重新定义,时间减半创世界纪录【新智元导读】近日,斯坦福大学研究团队把人类DNA测序的时间缩短至5小时2分钟,重新定义了人类基因组测序速度!DNA测序时间减半,还创下了最新吉尼斯世界纪录!近日,斯坦福大学研究团队完成了利用人工智能计算加速工作流程的「DNA巨量测序」技术。最新研究已于1月12发表在《新英格兰医学杂志》上。论文地址:https://www.nejm.org/doi/full/10.1056/NEJMc2112090此研究中处理速度最快的病例样本仅用了5小时2原创 2022-03-19 00:23:37 · 302 阅读 · 0 评论 -
考研 计算生物学 四川大学生科院
计算生物学 · 语雀原创 2022-03-18 22:50:59 · 617 阅读 · 0 评论 -
生物信息学简史
生物信息学简史2018-08-15, 7127 words, 26 min read前几天看到Briefings in bioinformatics发了一篇文章介绍生物信息学发展历史。个人有两个感慨,一是这样的文章也可以发表(不禁想给自己的博客投稿),二是感慨生物信息学发展之快。对整篇文章进行了粗糙的翻译整理,供大家了解。起源:1950-197020 世纪 50 年代早期,DNA 的历史地位还没有被建立,那个时候人们普遍认为蛋白质才是遗传信息的载体。直到 1952 年的噬菌体...原创 2022-03-18 19:10:57 · 4607 阅读 · 0 评论 -
中国高校生物信息学中心有哪些
灵犀智库自1997年以来,国内高校陆续开设了生物信息学专业,至今已经20余年。其中部分院校设置了专门的生物信息学中心,具有专门的生物信息学网站,具有较高的参考性。以下为博主尽力搜集到的具有生信网站的高校一览表,持续更新中。* 注意:部分院校虽然没有专门的生信网站,但是生信研究实力也很强,不要小看各高校哦。* 注意:关注这个账号,更多生信知识等你来。不定期回复私信。成立时间 中心名称 高校名称 网址 备注 1997 北京大学生物信息中心 北京..原创 2022-03-18 18:32:45 · 6151 阅读 · 0 评论 -
解读生命密码的基本手段——DNA测序技术的前世今生
解读生命密码的基本手段——DNA测序技术的前世今生任鲁风于军(中国科学院基因组科学及信息重点实验室,北京基因组研究所)DNA(脱氧核糖核酸)和RNA(核糖核酸)是生命体的两种最基本组成物质,其序列的组成和变化造就了形形色色的生命世界。这两种承担了生命体遗传信息载体功能的物质,一方面在生命的不断繁衍中保持了各个物种的独特面目,另一方面又通过不断的演变改变着自身性状,同时又影响着与之相关的物种,这一规律在生命科学领域被归纳为“中心法则”。笼统而言,几乎全部的生命现象均来源于A、T、C、G..原创 2022-03-17 19:15:19 · 1352 阅读 · 1 评论 -
PACBIO:经历9件大事,终获一致认可?
PACBIO:经历9件大事,终获一致认可?2021-05-08|热心肠先生原创独家收藏(0)|阅读(19)■ 肠企简介PacBio总部在美国硅谷,为客户提供高精准的长读长测序技术,为致力于解决复杂的遗传挑战的科学家提供宝贵的见解。为了推动分子生物学的发展,PacBio 的创始人发明了一种新方法来研究 DNA 和 RNA。利用生物化学、光学、纳米制造等方面的先进技术,PacBio 开发了单分子实时(SMRT)测序技术。通过以单分子分辨率实时分析 DNA 分子,这项...原创 2022-03-16 12:08:36 · 2776 阅读 · 0 评论 -
高通量测序技术的原理及各平台优势和实践应用的分析
高通量测序技术的原理及各平台优势和实践应用的分析2020.9.012060 随着人类基因组计划(human genome project )在2003年顺利完成,基因组测序技术取得了长足的进步,这直接导致了每兆基因组成本的大幅下降以及检测的基因组数量越来越多。人们对基因组的复杂性深感震惊,这也引导着测序技术的进一步发展。最近的一些突破性技术使得测序技术在更短的时间内可以获得更多的数据量。与之对应的是,还有一些技术的进步使得单条序列的测序读长变得更长——这对解析结构性的复合区段是极其必要的。这些原创 2022-03-15 20:32:22 · 5429 阅读 · 0 评论 -
Single Molecule Real-Time Sequencing
Single Molecule Real-Time SequencingPublished July 9, 2016Recently, I have witnessed the uprising of various next generation sequencing (NGS) platforms and it’s quite interesting because each platform uses a different method. Previously, I’ve writt原创 2022-03-15 20:22:26 · 426 阅读 · 0 评论 -
PacBio English 经典语句
Another consideration is the relatively high cost ofPacBio.精选另一个考虑因素是PacBio的成本相对较高。所在语境 引言来源论著2018IF 12.1Nature Communications升级获得更多母语英语作者的精选例句>ShorterPacBioreads fall into this category as well.精选较短的PacBio读数也属于这一类。所在语境 引言来源论...原创 2022-03-15 18:04:20 · 337 阅读 · 0 评论 -
英文论文写作
英文论文写作如何选择恰当表述用英文写论文时,经常不知如何表述。过去我们采取的做法是把想到的多种表述输入到google中,看哪一种出现频率高,哪一种就留下来。但这样做偶尔有问题,就是无法区分专业习惯和日常用语。最近,Springer出版集团推出了Exemplar。这是从学术论文中查找。用户甚至可以限定期刊,以便你查到的表述方式符合特定领域研究人群的习惯。详见本人博客。 措辞表述精选我们在英文专业论文的写作中经常不知道如何表达,或者感觉自己的表述非常笨拙。从上个月开始,每次看到欧美英语国家的原创 2022-03-14 23:30:39 · 153 阅读 · 0 评论 -
如何阅读 文献
如何阅读文献 当我们对课题领域有一定的了解后,应该更快速地阅读更多文献,熟悉领域前沿。我的建议如下。 阅读量和时间 • 研究生每周研读 3-6 篇课题重点参考的原创文献(非综述)。使用不超过 3 小时阅读每篇文献。 • 分配每天的固定时间为文献阅读时间。养成习惯后,到了时间就容易开始阅读。 • 如果读完一遍不完全懂,放几天后再读一遍。敢于承认自己的知识断点,不要花很多时间抠读不懂的地方。 • 积极寻求帮助和交流,和研究组成员讨论文章中的亮点和自己的疑问。 阅读原创 2022-03-14 18:40:37 · 433 阅读 · 0 评论 -
第三代DNA测序数据压缩方法研究
第三代DNA测序数据压缩方法研究崔浩翔深圳大学摘要:第三代测序技术自问世以来在临床分子诊断中扮演着越来越重要的角色,尤其在基因组测序、甲基化研究、突变鉴定(SNP检测)等方面。测序技术的不断发展使得测序成本逐年下降,测序数据量急剧增加,如何存储和传输庞大的测序数据是当前亟需解决的问题。数据压缩技术可以有效减少测序数据的存储空间并减少传输时间。通用压缩工具未能很好的利用DNA测序数据的数据特性,对测序数据的压缩比存在一定的局限。而目前DNA测序数据的专用压缩工具大多是针对第二代测序数据开发,在面对原创 2023-08-18 20:15:28 · 143 阅读 · 0 评论 -
07 R进阶
tidyverse《R数据科学》1、长、宽调整:gather-spread2、分、合:separate_unite3、处理NA#1x<data.frame(x1=letters[1:5],x2=1:5)x[2,2]<NAx[4,1]<NA#2drop_na(x)drop_na(x,x1)drop_na(x,x2)replace_na(x$x2,0)fill(x,x2)dplyr基础1、mutate() 新增列test原创 2022-03-14 00:32:25 · 459 阅读 · 0 评论 -
06 R语言作图
作图:ggplot2拼图 patchwork导出 eoffice——topptxif(!require(ggplot2))install.packages('ggplot2',update = F,ask = F)if(!require(ggpubr))install.packages('ggpubr',update = F,ask = F)if(!require(eoffice))install.packages("eoffice",update = F,ask = F)if(!req原创 2022-03-14 00:31:02 · 1833 阅读 · 1 评论 -
05. 文件读写
05. 文件读写补充#R语言提示词中文改英文,源头上需要从安装上解决,否则每次重启R语言时需要运行以下代码Sys.setenv(LANGUAGE='en')#列出目前所有变量 ls()#清除所有变量rm(list=ls())#加载R包时require和library的区别,!require()不仅可加载包还可返回逻辑值告知安装是否成功1.认识csv格式win10显示文件扩展名打开方式(-)默认excel(二)记事本打开(三)sublime原创 2022-03-14 00:27:27 · 883 阅读 · 0 评论 -
函数和R包
函数(1)形式参数与实际参数(2)写函数的函数圆括号里是形式参数,及设定的默认值 大括号里是jimmy函数的具体公式 举例 (3)默认参数复习绘图函数plot() 数值型向量,以x的小标为横坐标,以x的数据为纵轴 分别画iris里1,2,3,4列的数据 以第5列提供的种类画出不同颜色 写一个函数简化重复修改列数画4张图 当一个代码需要复制粘贴三次,就应该写成函数或使用循环R包1.R包原创 2022-03-14 00:25:18 · 683 阅读 · 0 评论 -
01.R与Rstudio
1.什么是R R是一种编程语言,也是统计计算和绘图的环境 它汇集了许多函数,能够提供强大的功能 R环境结合了 开源,可扩展的环境 简单有效的编程语言 数据处理、清理和存储 统计与可视化 2.什么是R studioR语言的集成开发环境 图形界面 优秀的学习工具 科研用途免费 开源 3.新建项目(R project) 切换Rproject.Rdata是什么..原创 2023-08-18 20:16:24 · 198 阅读 · 0 评论 -
Linux进阶 vim grep sed awk 正则表达式
01 Linux上的文本编辑器vimvim 编辑器是什么vim 编辑器的三种模式注意大小写!!!打开文件时文件可以存在或者不存在,不存在时当关闭的时候系统会创建命令模式• 用vim FILENAME进入之后的默认模式• 可以“上下左右”移动光标:方向键/hjkl• 可以剪切字符或整行、也可复制、粘贴移动光标:• 方向键或者hjkl• ^和$:快速到所在行的开头和末尾(用0也可以到开头)• 30j:向下移动30行(数字+方向进行快速移动)• ctrl原创 2022-03-14 00:07:21 · 1532 阅读 · 0 评论 -
Linux软件安装 conda
基础conda简介conda安装miniconda下载官方镜像&国内镜像下载:通常服务器在国内的选择清华或者北外,如果服务器在国外选择官网浏览器搜索:ctrl+Fwget -c, --continue resume getting a partially-downloaded file##国内镜像地址:wget -c https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64原创 2022-03-14 00:04:56 · 4042 阅读 · 1 评论 -
Linux 之shell脚本编程
01 Linux 系统环境文件系统结构/ 虚拟目录的根目录。通常不会在这里存储文件/bin 二进制目录,存放许多用户级的GNU工具/boot 启动目录,存放启动文件/dev 设备目录,Linux在这里创建设备节点/etc 系统配置文件目录/home 主目录,Linux在这里创建用户目录/lib 库目录,存放系统和应用程序的库文件/media 媒体目录,可移动媒体设备的常用挂载点/root root用户的主目录/sbin 系统二进制目录,存放许多GNU管理员级工原创 2022-03-13 23:58:33 · 5873 阅读 · 0 评论 -
Linux基础
课前预热课件准备工作:安装软件心理建设:linux系统介绍实战1:登录服务器填表法命令法sshJune16@192.144.162.230;密码是: pd29769ssh June16@192.144.162.230 #输好就按回车键,然后输入密码:pd29769可能遇到的问题网络异常:重新登录校园网不行就换下手机热点拒绝访问:设置登录端口如何退出登录重新登录正确填写范例练习1.原创 2022-03-13 23:52:05 · 1737 阅读 · 0 评论 -
Performance comparison of second- and third-generation sequencers using a bacterial genome with two
AbstractBackgroundThe availability of diverse second- and third-generation sequencing technologies enables the rapid determination of the sequences of bacterial genomes. However, identifying the sequencing technology most suitable for producing a finis原创 2023-08-18 20:16:46 · 33 阅读 · 0 评论 -
如何整理论文
如何整理论文 在下载了很多论文之后,我们需要对论文进行归类整理,方便梳理出领域发展的脉络,理清自己阅读论文的顺序和进度。整理论文一般分为本地文件组织和论文管理软件两种方式。本地文件组织统一命令规则 时间-作者-题名:梳理出同一作者或实验室历年的科研进展 时间-关键词-题名:梳理出领域内不同方法的演变历程 按类别归入文件夹 用电脑自带的搜索工具,搜索关键词论文管理工具 目前市面上有很多论文管理工具,最为出名的当属EndNote和Mendeley。E...原创 2022-03-12 21:08:56 · 1841 阅读 · 0 评论 -
中国科学家研发新的全基因组组装算法
重磅!中国科学家研发新的全基因组组装算法2019-12-10 00:01北京时间12月10日0时,《自然—方法学》在线发表了第一个能够跟上基因组测序产生速度的组装算法。这篇论文只有两位作者,他们是中国农业科学院农业基因组研究所阮珏博士,与美国哈佛大学医学院李恒博士。该新的第三代测序数据组装算法,被他们称为Wtdbg。李恒(左)和阮珏。阮珏供图十年前,Illumina基因组测序技术进入市场时,前所未有的庞大数据量,淘汰了较早开发的测序分析工具。历史总是重演。如今,第三代..原创 2022-03-12 19:34:29 · 1832 阅读 · 0 评论 -
三代测序数据分析实战
主讲人:徐怡,浙江大学医学院博士,目前在迪安诊断研发中心担任生物信息工程师,主要工作是负责 NGS 遗传检测PPT :三代测序数据分析实战.pptx背景介绍从1977年第一代DNA测序技术(Sanger法)发展至今三十多年时间,测序技术已取得了相当大的发展,从第一代到第三代乃至第四代,测序读长从长到短,再从短到长。虽然就当前形势看来第二代短读长测序技术在全球测序市场上仍然占有着绝对的优势位置,但第三和第四代测序技术也已在这一两年的时间中快速发展着。测序技术的每一次变革,也都对基因组研原创 2022-03-12 13:33:27 · 4573 阅读 · 0 评论 -
三代测序技术概况
三代测序技术概况原创mb5fe94870638be2020-12-29 20:44:49©著作权文章标签java文章分类Java编程语言阅读数1401第三代长序列测序技术为获得高质量的基因组数据提供了机遇。二代测序会产生很多数百个碱基大小的读长,而三代测序的读长可以长达10kbp。这种长读长对基因组的从头组装、基因组结构变异和基因分型(phasing)有重要的意义。自从二代测序技术商业化以来,很多测序平台相继出现,比如Roche/454(2005年),Illumina/Solexa(2.原创 2021-12-13 17:30:43 · 3373 阅读 · 0 评论 -
Pacbio HiFi技术原理与应用软件实例
Pacbio HiFi技术原理与应用软件实例原创生信技术生信技术2021-06-07 13:02收录于话题#基因组组装3个内容#生物信息3个内容#生信技术3个内容点击上方蓝字关注我们微信公众号:生信技术关注可了解更多的教程及技巧。问题或建议,请公众号留言;本文将从以下四部分介绍一、HIFI技术的简介二、HiFi建库流程三、HiFI组装实例四、全基因组测序的组装流程一、HIFI...原创 2021-12-11 19:40:12 · 2986 阅读 · 0 评论 -
【数据库】SRA数据库介绍及数据下载
【数据库】SRA数据库介绍及数据下载生信技术2021-10-06 11:00以下文章来源于生信Alpha,作者BioinfoPenn生信Alpha.生物信息、生物统计、Linux系统、shell、R、Python等日常学习记录分享~欢迎交流指正~【数据库】SRA数据库介绍及数据下载 -目录 1. SRA数据库介绍 (1) SRP开头的ID:PRJNA = SRP (2) PRJNA开头的ID:SAMN = SRS (3) SRX开头的...原创 2021-12-11 19:36:00 · 16514 阅读 · 0 评论 -
PacBioHiFi+HiCanu完成准确度超99.999%,Contig N50达77Mb的人基因组组装结果
PacBioHiFi+HiCanu完成准确度超99.999%,Contig N50达77Mb的人基因组组装结果2020-03-31 09:55最近来自美国NIH的生信科学家在预印本文献上发表了他们最新使用PacBio HiFi Reads组装基因组的数据,文章标题:HiCanu: accurate assembly of segmental duplications, satellites, and allelic variants from high-fidelity long reads..原创 2023-08-18 20:17:46 · 376 阅读 · 0 评论 -
PacBio HiFi测序介绍及百迈客最新下机数据公布
PacBio HiFi测序介绍及百迈客最新下机数据公布百迈客生物已认证账号已关注3 人赞同了该文章众所周知,要获得基因组的完整图片,就必须组装reads,以目前主要的测序技术来看,短读长测序提供了很高的准确性,但仅提供了少量数据片段,从而只能得到不完整的图片;而传统的长读长测序,可提供更大的图像,但缺乏准确性,因此很难分辨出真实的生物学变异与测序错误之间的区别。然而,兼顾长读长与高精度的HiFi测序正在改变一切,今天我们就来聊聊HiFi测序以及百迈客PacBio SequelⅡ原创 2021-12-11 18:05:04 · 551 阅读 · 0 评论 -
PacBio HiFi测序介绍及百迈客最新下机数据公布
PacBio HiFi测序介绍及百迈客最新下机数据公布百迈客生物已认证账号已关注3 人赞同了该文章众所周知,要获得基因组的完整图片,就必须组装reads,以目前主要的测序技术来看,短读长测序提供了很高的准确性,但仅提供了少量数据片段,从而只能得到不完整的图片;而传统的长读长测序,可提供更大的图像,但缺乏准确性,因此很难分辨出真实的生物学变异与测序错误之间的区别。然而,兼顾长读长与高精度的HiFi测序正在改变一切,今天我们就来聊聊HiFi测序以及百迈客PacBio SequelⅡ原创 2021-12-11 18:04:24 · 1724 阅读 · 0 评论