- 博客(40)
- 收藏
- 关注
原创 生信学习网站推荐
I’m back!好久不更新博客了,不过学习依旧持续着B站上有好多免费的生信课程,最近在学习“生信技能树”出品的生信教程,很干货,收获很多,推荐给初学的小伙伴们。生命不息,学习不止,想学好生信在于多听多看和多多练习,同时不断思考,保持兴趣。这一阶段的目标是复现文章数据分析,加油!...
2020-10-15 22:40:57 777 3
原创 疯狂Python讲义笔记-20191215
想系统学习python中 matplotlib, numpy, scipy, pandas。找到一篇知乎https://www.zhihu.com/question/37180159其中的视频教程有待研究,先参考https://github.com/lijin-THU/notes-python李金的Python笔记,以及李刚的《疯狂python讲义》,对比较重要又容易忘记的Python功能进行记...
2019-12-15 22:05:56 647
原创 Lecture 5——DNA-seq-2_Bioinformatics and Statistical Topics
本文图片来自于学习视频——新一代测序技术数据分析第五讲 DNA-seq2_Bioinformatics and Statistical TopicsSequence mappabilityHuman genomeThe minimum length (number of nucleotides) can be uniquely mapped back to human genome?In...
2019-10-15 09:29:46 973
原创 Lecture 3——DNA-seq-1
本文图片来自于学习视频——新一代测序技术数据分析第三讲 DNA-seqReviewAlignment srategiesSmith-Waterman(speed too slow to use)Fast alignmentHash tableSeed and extensionMask(for mismatches)Suffix tree/prefix treeSuffix ar...
2019-10-14 08:44:12 840
原创 Lecture 2——Basics of data processing
本文图片来自于学习视频——新一代测序技术数据分析第二讲Lecture 2——Basics of data processingReview Lecutre 1OutlineDate analysis workflowSequence qualify evaluationPhred scoresNGS error ratesAlignmentSmith-Waterman algo...
2019-10-11 20:36:07 435
原创 新一代测序技术数据分析第一讲(综述)
本文图片来自于学习视频——新一代测序技术数据分析第一讲(综述)SOLiD: Sequence-by-ligationAmplification: emulsion PCRBase detection:mixture of labeled oligonucleotides and queriesthe input strand with ligaseColor space vs. bas...
2019-10-10 20:18:54 2092
原创 山大公开课笔记——数据挖掘
数据挖掘一、三要素:1. 统计2. 数据库系统3. 机器学习数据库系统 DBS(Database System)数据库管理系统 DBMS(Database Management System)+ 数据库 DB(Database)= DBSsoftware for management data storage二、常用的数据库系统:1. 关系型数据库系统:e.g. ...
2019-10-09 20:00:38 366
原创 山大公开课——高通量测序1
Sequencing bias/errors1. 产生原因454:识别不同荧光信号,不易区分homopolymerIllumina:当分子簇形成数量较少时,不能灵敏地捕获荧光信号;及信号冲突,对于High GC区域的覆盖度比较低。2. 解决方法(Correcting errors in short reads by multiple alignments/ Quake: quality-a...
2019-10-09 14:59:08 439
原创 山大公开课学习笔记3
软件预测蛋白质二级结构通过氨基酸序列,预测蛋白质二级结构常用软件:PSIPRED、Jpred3、PREDICTPROTEIN、SSpro、PSSpred、PREDATOR、GOR V蛋白质的三级结构测定主要方法:X射线衍射法、核磁共振法(分子量小的蛋白质)等PDB检索,或Advanced search蛋白质三级结构可视化软件Pymol、VMD(免费)、Maestro、CanvasM...
2019-10-09 10:52:47 612
原创 山大公开课笔记2
第五节 蛋白质数据库一、一级蛋白质数据库一级蛋白质序列数据库swissprot、TrEMBL、PIR 三者共同构成UNIPROT(1)swissprot: 一个人工注释的蛋白质序列数据库,拥有注释可信度高、冗余度小的优点。由欧洲生物信息学研究生EMBL-EBI与瑞士生物信息学研究生SIB共同管理。(2)TrEMBL(translation from EMBL): 一个计算机注释的蛋白质...
2019-10-08 20:10:03 827
原创 next-generation sequencing analysis method——paper3
Abstract: available software to align reads to a reference; use resulting alignments to call, annotate, view, and filter small sequence variants; variant calling includes read alignment with novoalig...
2019-10-02 14:14:16 615
原创 next-generation sequencing analysis method——paper2
Here, we outline some of the tools and databases commonly used for the analysis of next-generation sequence data with comment on their utility.GENOME ASSEMBLYALGORITHMS(1)SSAKE: one of the first sh...
2019-09-28 19:15:12 307
原创 next-generation sequencing analysis method——paper1
半路出家会有很多困惑,我想若要踏实基础,一步步了解二代测序所有过程,读paper应该是正统。因此今天在Web of Science中检索"next-generation sequencing analysis method",找到多篇关于二代测序的发展历史,分析方法及应用等方面的文章,并在读后记录下来心得,应该会有所提高。第一篇:来自于:Omics Technologies and Bio-...
2019-09-26 21:47:45 608
原创 Bioinformatics with Python Cookbook.1
Chapter 1 Python and the Surrounding Software Ecology本章主要介绍linux上Python及周边软件的安装,为此,应先了解linux系统版本信息以及已经安装了哪些软件,若已经安装了Python,但仍想通过Anaconda安装Python,最好unset PYTHONPATH,或者卸载已安装的Python和libraries。查看Linux版...
2019-09-25 19:11:39 368
原创 Bioinformatics Data Skills by Oreilly学习笔记-12
Chapter12 Bioinformatics Shell Scripting, Writing Pipelines, and Parallelizing TasksWe’ll see how to write rerunnable Bash shell scripts, automate fileprocessing tasks with find and xargs, run pipeli...
2019-09-13 14:47:42 376
原创 Bioinformatics Data Skills by Oreilly学习笔记-11-2
接上一篇Chapter 11Visualizing Alignments with samtools tview and the Integrated Genomics ViewerSamtools tview requires position-sorted and indexed BAM files as input.
2019-09-09 21:59:49 705
原创 Bioinformatics Data Skills by Oreilly学习笔记-11-1
Chapter 11 Working with Alignment Data突然觉得这是一本比较基础的且要有耐心才能看下去的书,但作者介绍的比较繁琐,没有直入主题,基本的分析流程和背景并不太成体系。有基础的人甚至可以直接跳到11章,想快点看完进入下一本了。The Sequence Alignment/ Mapping (SAM) format for mapping data (and its...
2019-09-08 17:09:55 752
原创 Bioinformatics Data Skills by Oreilly学习笔记-10
Chapter 10 Working with Sequence DataNucleotide (and protein) sequences are stored in two plain-text formats widespread in bioinformatics: FASTA and FASTQ—pronounced fast-ah (or fast-A) and fast-Q, r...
2019-09-03 21:03:21 604
原创 Bioinformatics Data Skills by Oreilly学习笔记-9
Chapter9 Working with Range DataA Crash Course in Genomic Ranges and Coordinate SystemsCrossMap is a command-line tool that converts many data formats (BED, GFF/ GTF, SAM/BAM, Wiggle, VCF) between c...
2019-09-01 17:07:11 213
原创 Bioinformatics Data Skills by Oreilly学习笔记-7-4
接上一篇Chapter7Advanced Shell TricksSubshells$ echo "this command"; echo "that command" | sed 's/command/step/'this commandthat step$ (echo "this command"; echo "that command") | sed 's/command/ste...
2019-08-31 22:10:02 194
原创 Bioinformatics Data Skills by Oreilly学习笔记-7-3
接上一篇Chapter7Text Processing with AwkTwo basic concepts——records and fields, and pattern-action pairsAssigns the entire record to the variable $0, and field one’s value is assigned to $1, field two’...
2019-08-31 21:46:59 266
原创 Bioinformatics Data Skills by Oreilly学习笔记-7-2
接上一篇Chapter 7The All-Powerful Grepgrep “pattern” files–color=autogrep 是贪婪匹配,用**-w**进行准确匹配(constraining our matches to be words),默认输出行。$ cat example.txtbiobioinfobioinformaticscomputational ...
2019-08-29 21:37:04 377
原创 Bioinformatics Data Skills by Oreilly学习笔记-7-1
PART III Practice: Bioinformatics Data SkillsChapter7 Unix Data ToolsInspecting and Manipulating Text Data with Unix ToolsIn this chapter, we’ll work with very simple genomic feature formats: BED (...
2019-08-26 21:31:24 380
原创 Bioinformatics Data Skills by Oreilly学习笔记-6
Chapter6 Bioinformatics DataRetrieving Bioinformatics DataDownloading Data with wget and curlTwo common command-line programs for downloading data from the Web are wget and curl. Depending on your ...
2019-08-25 17:28:30 497 1
原创 Bioinformatics Data Skills by Oreilly学习笔记-4、5
Chapter4 Working with Remote MachinesMaintaining Long-Running Jobs with nohup and tmux1. nohupBecause the nohup command is catching and ignoring these hangup signals, the program you’re running won...
2019-08-25 14:37:12 210
原创 Bioinformatics Data Skills by Oreilly学习笔记-3
Chapter 3 Remedial Unix Shell== In this chapter, we’ll cover remedial concepts that deeply underly how we use the shell in bioinformatics: streams, redirection, pipes, working with running programs,...
2019-08-24 21:06:00 379
原创 Bioinformatics Data Skills by Oreilly学习笔记-2
Chapter2 Setting Up and Managing a Bioinformatics ProjectOrganizing Data to Automate File Processing TasksShell Expansion Tips$ echo dog-{gone,bowl,bark}dog-gone dog-bowl dog-bark$ mkdir -p zm...
2019-08-23 20:09:13 266
原创 Bioinformatics Data Skills by Oreilly学习笔记-1
Chapter1. How to learn bioinformatics看起来是琐碎的小技巧,甚至是关于信仰的东西,可能要真正投入进去,才能慢慢体会,看得不太认真,许多略过的东西,以后可以再回头看。Test Code, or Better Yet, Let Code Test Code学到了用Code test code:...
2019-08-22 20:20:12 510 2
原创 Bioinformatics Data Skills by Oreilly——学习生信的入门好书
翻阅《生信宝典》公众号,偶然看到推荐的两本生信入门好书,分享给大家:《Bioinformatics Data Skills - - Reproducible.and.Robust.Research.with.Open.Source.Tools》链接:》链接: 接: https://pan.baidu.com/s/1c2g0MPU 密码: 密码: v2c9《Bioinformatics wi...
2019-08-21 22:17:10 3179
原创 生物信息学初学——山大公开课笔记
2019年8月20日,南京闷热生物信息学研究对象核酸测序及应用;基因序列注释;基因预测;核酸序列比对;核酸数据库;比较基因组学;宏基因组学;基因进化;RNA结构预测;等蛋白质蛋白质数据库;蛋白质序列比对;二/三级结构预测;相互作用分析;分子动力学模拟;分子对接;蛋白质组学;等其他代谢网络模拟;数据挖掘分析;序列算法开发;计算进化生物学;生物多样性研究;等课程提纲生物数据库 序列比...
2019-08-20 23:08:11 2253
原创 疯狂Python讲义笔记
第3章 列表、元组、字典##Python的序列创建列表:my_list = [, , , ];创建元祖:my_tuple = (, , ,)索引:a_list/tuple[0]列表和元组的通用用法子序列(slice): [start : end : step] start在end的左边加法:只能同类型相加 e.g. sum_tuple = a_tuple + b_tu...
2019-08-08 21:44:49 2366
原创 生信分析常用软件记录
20190727,在学习二代分析的过程中,只是根据别人已经建好的轮子照抄照搬,并不能真正理解每一步为什么要用这个软件,以及软件之间的区别。因此今天记录一些生信分析过程(主要是二代测序)中常用的软件,若有时间去查看一下每个软件的功能、官方介绍和算法等。不按顺序的杂乱记录sd linux安装软件R, tanperl5lib, augustus-3.3.2, bamtools-2.4.2, bed...
2019-07-27 13:25:28 2597
原创 生信小白学习日记Day6——NGS分析流程(before bwa)
2019年6月1日,祝大家节日快乐,抖音上有个视频,采访10后熊孩子:你认为90后现在多大了?熊孩子:umm, 40-50岁吧;“你认为他们还应该过儿童节吗?”“不应该,因为他们已经是老人了。”==!上一篇文章中用bwa mem算法进行序列比对时, 用到了一些上一步产生的laneid、{lane_id}、laneid、{sample}的这些变量,那么这篇就来尝试解读一下bwa比对之前批量读取原...
2019-06-20 19:27:25 1123
原创 生信小白学习日记Day7——WGS分析流程(picard)
2019年6月2日,周日,天气晴,pass 上午。开始学习NGS分析,继BWA比对和SAM文件排序转BAM后的流程。NGS分析step5 Mark Duplications参考这篇:GATK使用方法详解。https://www.plob.org/article/7009.html在制备文库的过程中,由于PCR扩增过程中会存在一些偏差,也就是说有的序列会被过量扩增。这样,在比对的时候,这些过...
2019-06-02 16:39:42 13519 5
原创 生信小白学习日记Day4Day5——NGS基础 NGS分析注释(BWA软件)
2019年5月30日,晚上,心情变好,好几天没更新了,看到男朋友在学一款软件,我也近朱者赤,来继续注释Day2-2中NGS分析流程中的一个重要软件——BWANGS基础NGS分析注释BWABWA是目前常用的将测序回来的reads比对到参考基因组上的软件,简单来说,参考基因组相当于一整块已知的地图,而reads是被切碎的,与已知地图存在少量区别的地图碎片,而BWA要做的就是找到两者之间的相似信...
2019-05-30 23:29:33 2322 3
原创 生信小白学习日记Day3——NGS基础 NGS分析注解(质量分析软件)
2019年5月27日,天气舒适,忙碌一天之后开始今天的生信学习。今天就昨天Day2-2的一些标记加以查询说明,仅供参考。NGS基础NGS分析注解1. 质量分析软件昨天提到,拿到数据后可以通过一些软件来评估测序质量的好坏,包括fastqc、multiqc、SolexaQA等。我们今天来了解一下multiqc和SolexaQA的使用。multiqc来自于博文:https://blog.cs...
2019-05-27 22:41:24 3150 1
转载 生信小白学习日记Day2-2——NGS基础 NGS分析
2019年5月26日下午,无意中看到hanli0902的关于NGS分析的博文https://blog.csdn.net/hanli1992/article/details/82790386有很多需要学习的地方,在这里贴一些并就不理解之处做些笔记,仅供参考。NGS基础——NGS分析NGS 分析步骤1. 质量分析fastqc、multiqc、SolexaQA测序数据的质量好坏会影响我们的下...
2019-05-26 15:51:27 3463 1
原创 生信小白学习日记Day2——NGS基础 illumina高通量测序原理
2019年5月26日,周日,小雨说明:阅读生信宝典和查阅文章的总结,原文请关注公众号生信宝典,参考的博文都附有链接,仅供参考。生信宝典NGS基础——高通量测序原理本文介绍了测序文库构建原理、链特异性文库构建方式和识别方法、测序簇生成过程、双端测序过程、测序接头产生、PCR duplicate、测序通量选择标准等。原文都是一张张PPT,截图下来之后,附一些自己理解的注释吧以目前最常用的il...
2019-05-26 12:43:09 12100 1
原创 生信小白学习日记-day1——NGS基础 FASTQ格式解释和质量评估
2019年5月25日,一个普通的周六,正在听的歌——北京东路的日子,开始学习生信,写博客。生信宝典系列教程关于编程学习的一些思考知乎专栏:https://zhuanlan.zhihu.com/Data-Analysis这篇文章讲述两个问题:系统学习还是遇到问题再找答案?是否要写博客。第一个问题,两种途径都可以,都可以成为大神,但其一,要付出足够多的时间去写代码,修复bug;其二,要多...
2019-05-25 16:58:37 2670
转载 欢迎使用CSDN-markdown编辑器-1
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Ma...
2019-05-25 13:26:55 155
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人