排序:
默认
按更新时间
按访问量

Elon写在CSDN上的最后一篇博客

CSDN—-号称是中国最大的程序员博客站点 它也是我曾今挥笔写博的地方,伴随着我的大学生涯。正是因为它的知名度,我选在这里,而不是比如博客园、cnblog、开源中国等等之类的地方。 但是在过去的半年多,我逐渐尝试自己搭VPS 建WordPress,利用hexo或是Jekyll等框架搭建自定义的...

2018-08-31 21:59:24

阅读数:42

评论数:0

AWS备考

本是忙碌而充实的一个月,正准备AWS SOA的认证考试,需要花时间花精力,按照计划来执行啊!

2018-08-26 22:56:14

阅读数:66

评论数:0

摘要

本论文主要研究内容是将传统的全基因组测序与Hadoop框架结合的大数据测序平台研发,通过Hadoop中的HDFS分布式存储系统来提供高可靠的存储服务,结合基因测序的一系列软件工具(如:BWA、Samtools、Picard和GATK等)来进行测序流程设计,并引入第三方FreeMarker模板引擎来...

2018-07-28 11:56:00

阅读数:76

评论数:0

参 考 文 献

[1] Sanger, F. & Nicklen, S. DNA sequencing with chain-terminating[P]. 74, 5463–5467 (1977). [2] Struster SC.Next-generation sequencing ...

2018-07-28 11:52:47

阅读数:114

评论数:0

致 谢

从论文的选题、资料收集再到撰写的整个过程,在碰到基因测序的疑难问题时,得到了许多老师和同学的热情帮助。 首先,我要感谢的是我的导师邝祝芳老师,当他得知我的毕设课题需要大数据平台与基因测序结合,询问我是否需要高性能计算的服务器,并随后立马帮我申请了湖南大学的天河一号超级计算机的使用账号。在我毕业设...

2018-07-28 11:51:24

阅读数:43

评论数:0

结 论

在本次的论文中,主要对Hadoop大数据框架做了深入了解,并对生物信息学中基因测序领域有了一个全新的认识。在这次基于Hadoop的基因组测序大数据分析平台研究的课题中,构建了针对生物全基因组的测序流程,并将自己所学的大数据领域的知识与全基因组测序流程相结合,利用Hadoop特有的HDFS分布式存储...

2018-07-28 11:49:42

阅读数:35

评论数:0

5 系统的测试与扩展

[返回主目录] 5 系统的测试与扩展 5.1 MRUnit测试类编写 5.1.1 Map任务的测试类编写与调度 5.1.2 Reduce任务的测试类编写与调度 5.2 Hadoop测序平台的测试 5.2.1 测试环境与测试数据准备 5.2.2 系统平台的测试 5.3 测序平台的分析与...

2018-07-28 11:46:12

阅读数:39

评论数:0

4 基于Hadoop的平台搭建与MapReduce作业设计

[返回主目录] 4 基于Hadoop的平台搭建与MapReduce作业设计 4.1 基于Hadoop的伪分布式平台搭建 4.1.1 搭建Hadoop伪分布式平台 4.1.2 启动和停止Hadoop集群 4.2 伪分布式环境的MapReduce作业构建 4.2.1 Mapper流程构造 4...

2018-07-28 11:17:57

阅读数:56

评论数:0

3 基于Hadoop基因测序数据处理关键技术的研究

[返回主目录] 3 基于Hadoop基因测序数据处理关键技术的研究 3.1 测序处理流程与MapReduce结合 3.1.1 测序流程与MapReduce结合的可行性分析 3.1.2 测序流程与MapReduce框架的结合 3.2 不同格式数据的访问与存储 3.2.1 数据访问于存储面临...

2018-07-28 10:50:48

阅读数:78

评论数:0

2 相关技术及原理

2 相关技术及原理 2.1 Hadoop相关技术和原理 本节主要对基于Hadoop平台的相关技术,如:HDFS、YARN和MapReduce三大模块进行原理介绍 ,为后续基因测序在Hadoop平台上的搭建作相应的准备。 2.1.1 HDFS分布式存储系统 Hadoop分布式存...

2018-07-28 00:52:27

阅读数:105

评论数:0

AWS-EC2挂载EBS卷

在AWS控制台新建一个卷之后,并Attached到EC2实例上之后,登录该实例,通过命令lsblk可以查看当前可用的卷信息 NAME ...

2018-07-11 15:25:43

阅读数:133

评论数:0

AWS-EC2自动挂载EBS卷或磁盘

linux下自动挂载的配置文件是放在 [root@ip-172-31-10-1 mongodb]# cat /etc/fstab # # /etc/fstab # Created by anaconda on Mon Feb 22 17:08:22 2016 # # Accessible ...

2018-07-11 14:43:28

阅读数:141

评论数:0

【2018-07-04】工作日志

今天上午在学习部署deploy项目,在最后环境各方面搭建完成之后,需要对deploy项目进行进一步调试,使其能够适应我部署的系统环境,于是通过eclipse本地调试的方式,进行断点跟踪,最终在较少的时间内定位的问题点,并快速明白了该处容器检测过程的业务逻辑代码。 介绍一下这个deploy项...

2018-07-04 23:24:06

阅读数:200

评论数:0

AWS EC2如何从普通用户切换为root用户

通过命令 sudo -s 可以实现从普通用户转为root用户 通过 exit 可以从root用户退回到普通用户

2018-07-04 20:03:58

阅读数:548

评论数:0

获取服务器的CPU和内存信息

[centos@ip-172-31-1-1 tomcat7]$ cat /proc/cpuinfo processor : 0 vendor_id : GenuineIntel cpu family : 6 model : 79 model name : Intel(R) ...

2018-07-04 19:15:08

阅读数:254

评论数:0

AWS服务资源可访问位置说明

有些资源可以在所有地区 (全球) 使用,而有些资源则特定于其所在的区域或可用区。 资源 类型 描述 AWS 账户 服务全球 您可以在所有区域使用同一个 AWS 账户。 密钥对 全球性或区域性 您使用 Amazon EC2 创建的密钥对与您在其中...

2018-07-02 19:28:30

阅读数:100

评论数:0

绪论

1 绪论 1.1 论文的研究背景及意义 全基因组测序的英文是 Whole Genome Sequencing,简称WGS。它是将物种细胞里从第一个DNA开始一直到最后一个DNA的完整基因组序列,通过相关仪器和技术手段检测出来并排序好得到一种文本格式的文件,最后再将其和参考基因组做比对,鉴定...

2018-07-01 20:10:01

阅读数:140

评论数:0

基于Hadoop的基因组测序大数据分析平台研究

首先要声明的是,基于Hadoop的基因组测序大数据分析平台研究是本人2018年的毕业设计课题,根据网络资源和自己的专业知识,独立完成整个流程设计、平台搭建和单元测试等工作。本系列文章是对该项目的一个整理总结和分享记录。 开发环境介绍:通过本人的2014年款ThinkPad开发,内存是8G...

2018-07-01 19:24:26

阅读数:250

评论数:0

AWS-EC2 使用命令行查找区域和可用区

使用describe-regions命令描述您的账户的区域 下面是通过账户访问所有AWS区域列表 [centos@ip-172-31-48-15 ~]$ aws ec2 describe-regions REGIONS ec2.ap-south-1.amazonaws.com ap-...

2018-06-28 16:03:08

阅读数:327

评论数:0

Docker启动问题排查

当docker镜像被制作之后,通过sudo docker images命令可以查看到镜像已经被制作。正常情况下已经在Dockerfile中配置启动命令,因此container容器也已经被启动。但是当镜像内部发生问题时,容器是启动不成功的,可以通过sudo docker ps -a查看所有容器,其中...

2018-06-25 14:21:08

阅读数:624

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭