- 博客(25)
- 资源 (23)
- 收藏
- 关注
原创 Scala学习2之spark学习6之scala版本不同的问题
Spark之scala版本不同的问题:用sbt编译有问题,但可以执行:hadoop@Master:~/cloud/testByXubo/sh_spark_xubo/WordCountByTimeNoSort$ sbtRun.sh [info] Set current project to helloworld project (in build file:/home/hadoop/c
2016-01-29 22:30:57 4462
原创 Scala学习1之用sbt和脚本一步编译打包运行scala程序
用sbt和脚本一步编译打包运行scala程序脚本:cp /home/hadoop/cloud/scala-2.10.5/sbt/LocalScala1/build* ./cp -r /home/hadoop/cloud/scala-2.10.5/sbt/LocalScala1/project ./sbt compilesbt packagesbt run
2016-01-29 17:34:55 4396 1
原创 spark学习5之sbt问题
Spark和scala之sbt问题按照参考【1】顺利安装了sbt,并显示hadoop@Master:~/cloud/scala-2.10.5$ sbt sbt-version[info] Set current project to scala-2-10-5 (in build file:/home/hadoop/cloud/scala-2.10.5/)[info] 0.13.
2016-01-28 22:11:29 8380 1
原创 hadoop之WordCoun输出文件用时间命名,避免每次运行都要修改
hadoop之WordCoun输出文件用时间命名,避免每次运行都要修改代码://public class WordCount {////}import java.io.IOException;import java.text.SimpleDateFormat;import java.util.*; import org.apache.hadoop.conf.Con
2016-01-28 21:41:30 793
原创 JAVA问题总结之30--输出当前精度为毫秒的时间并且按时间批量建立文件
JAVA问题总结之30--输出当前精度为毫秒的时间并且按时间批量建立文件1.TimeByMs.javapackage java1;import java.util.Date;import java.text.*;public class TimeByMs { public static void main(String[] args) { // TODO Auto-ge
2016-01-28 21:30:51 1342
原创 spark学习4之集群上直接用scalac编译.scala出现的MissingRequirementError问题(已解决)
报错代码:hadoop@Master:~/cloud/test/sh_spark_xubo/SparkPi$ scalac org/apache/spark/examples/SparkPi.scala error: scala.tools.nsc.MissingRequirementError: object scala.reflect.Manifest not found. at
2016-01-27 21:40:28 3050 3
原创 spark学习3之examples中的SparkPi
Spark examples之SparkPi环境:服务器:ubuntu spark 1.5.2编写环境:window eclipse可以直接在集群上跑,为了熟悉流程,先下载到window,然后打成jar包上传运行:1.下载SparkPi.scala:地址:/home/hadoop/cloud/spark-1.5.2/examples/src/main/s
2016-01-27 19:36:24 4482
原创 Spark问题之More than one scala library found in the build path
Spark问题之More than one scala library found in the build path在window的eclipse上搭建spark时出错:More than one scala library found in the build path (D:/1win7/eclipse/plugins/org.scala-lang.scala-library
2016-01-26 22:28:25 4624
原创 Spark1.5.2在eclipse生成jar提交到集群运行
Spark1.5.2在eclipse生成jar提交到集群运行环境:window7ubuntu spark1.5.21.WordCountSpark.scala代码://class WordCountSpark {// //}import org.apache.spark._import SparkContext._object WordCount
2016-01-26 22:05:52 2477 3
原创 window上连接集群跑hadoop问题之java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.
环境:window7 64位集群hadoop2.6.0,ubuntuwindow上连接集群跑hadoop问题之java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.$Windows.参照http://blog.csdn.net/congcong68/article/details/420430
2016-01-26 15:32:51 18003
原创 aspera connect使用的问题
aspera connect使用的问题:为何ascp老是报错?网络的问题?hadoop@Mcnode1:~/.aspera/connect/etc$ ascp -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200m anonftp@ftp.ncbi.nlm.nih.gov:1GB ./
2016-01-20 21:16:34 14160 13
原创 课程流恢复步骤和恢复后的地址
课程流恢复步骤和恢复后的地址(一)课程流恢复步骤:1.安装apache、php、mysql和phpmyadmin等2.代码、附件和数据库迁移之前备份的phpwind代码不全,需要重新下discuz!3.1的代码,然后再附件等data迁移进来数据库备份的是2015.3.10之前的,不全,百度云有备份至6.25的。(二)课程流恢复的链接地址:ht
2016-01-20 15:50:29 797
原创 用Aspera connect从NCBI上下载SRA格式数据
用Aspera connect从NCBI上下载SRA格式数据:一. window1.下载地址:http://downloads.asperasoft.com/connect2/2.安装很简单,略3.下载:数据下载地址:http://www.ncbi.nlm.nih.gov/projects/faspftp/1000genomes/
2016-01-13 22:08:29 18528 2
原创 BWA软件安装和使用
BWA软件安装和使用:1.安装请参考【1】2.使用:hadoop@Mcnode1:~/cloud/adam/xubo/data/down-sratool/sra$ bwa aln ../../dmel-all-chromosome-r5.37/dmel-all-chromosome-r5.37.fasta DRR047093.fastq >RAL357_1.sai[b
2016-01-13 20:54:48 13837
原创 使用fastq-dump下载SRA数据
使用fastq-dump下载SRA数据环境和配置请见系列博文1.下载:fastq-dump -Z DRR047093然后会显示信息:如果文件过大会有很多可以显示制定条数fastq-dump -X 5 -Z DRR047093文件位置:自己安装sratoolkit时配置的位置hadoop@Mcnode1:~/cloud/adam/xubo/data/do
2016-01-13 19:45:25 16154 2
原创 ubuntu下使用sratoolkit将sra文件转换成fastq文件
ubuntu下使用sratoolkit将sra文件转换成fastq文件:环境:ubuntu14.04sratoolkit.2.5.5-ubuntu641.下载下载地址:http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?cmd=show&f=software&m=software&s=software#2.将
2016-01-13 13:57:18 10173
原创 window下使用sratoolkit将sra文件转换成fastq
window下使用sratoolkit将sra文件转换成fastq并将fastq转换成fasta文件1.ncbi下载sra文件ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR002/SRR002644/SRR002644.sraftp://ftp-trace.nc
2016-01-12 22:24:53 12767 2
原创 SRAtoolkit使用
SRAtoolkit使用1.下载安装:http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=toolkit_doc&f=std.sra转fastq文件:待完成
2016-01-12 22:23:27 9074 2
原创 linux在history上加上命令执行时间,用户和IP源等
1.设置显示时间和用户:echo 'export HISTTIMEFORMAT="%F %T `whoami` "' >> /etc/profile执行source生效:source /etc/profile查看结果:history 1852 2016-01-11 16:24:52 xubo hs 1853 2016-01-11 16:24:53 xubo ls
2016-01-12 12:17:08 3327 1
原创 linux常用指令
1.列出文件清单并按时间排序,且显示的是k或者M,而非字节:ll 相当于ls -l-t 按时间排序-h 文件的实际大小,带单位显示hadoop@Master:/var/log$ ll -h -ttotal 4.5M-rw-r----- 1 syslog adm 89K 1月 11 14:22 auth.log-rw-r----- 1
2016-01-11 14:39:55 1162 5
原创 人类基因组参考基因组
人类基因组参考基因组:GRCh38下载地址:ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/technical/reference/GRCh38_reference_genome/使用以上数据的有:https://github.com/chapmanb/cloudbiolinux/blob/master/ggd-recipe
2016-01-08 22:25:25 6457
原创 SNAP建立索引的时候出现问题
hadoop@Mcnode1:~/cloud/adam/xubo/snap$ ./snap-aligner index ../../down/xubo/GRCH38/GCA_000001405.15_GRCh38/seqs_for_alignment_pipelines.ucsc_ids/GCA_000001405.15_GRCh38_full_plus_hs38d1_analysis_set.f
2016-01-08 21:49:18 1652 2
原创 amplab实验室的SNAP算法运行和操作
amplab实验室的SNAP算法运行和操作:环境:ubuntu14.041.安装:参考【1】和【2】,需要:g++ version 4.6zlib 1.2.8 from http://zlib.net/安装:sudo apt-get install g++sudo apt-get install zlib1g-devzlib没有直接的安装包,
2016-01-08 17:07:16 1908
原创 待学习
工具:adam—使用Apache Avro, Apache Spark 和 Parquet的基因组处理引擎,有专用的文件格式,Apache 2软件许可。bioscala —Scala语言可用的生物信息学程序库论文:https://scholar.google.com/scholar?cluster=12239508958754333100&hl=zh-CN&as_sdt
2016-01-07 15:14:15 694
opencv 3.4.1 jar
2018-05-16
JDK.API.7_English.chm
2015-08-24
Java 2 SE 6 Documentation.chm
2015-08-24
JavaSE中文API.chm
2015-08-24
jdk api 1.7英文版-带索引
2015-08-24
isrgb.m,matlab
2014-03-27
计算方法实验Gauss_Seidel法和Runge_Kutta法
2013-10-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人