![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
二代测序分析
XH生信ML笔记
无计算机背景的生信入坑者一枚,生物狗一只,读博时初涉linux,以后陆续入坑python,r,Machine Learning,Deep Learning。主页主要是备份代码,如果能帮助到其他朋友就更好。
展开
-
conda 安装宏基因组软件megahit出现CondaHTTPError: HTTP 000 CONNECTION FAILED for url问题
使用conda 安装MEGAHIT 软件时,出现 Solving environment: failed CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://repo.anaconda.com/pkgs/r/linux-64/repodata.json.bz2>:的错误:直接安装$ ./conda install -c bioconda megahitSolving environment: failedCondaHT原创 2021-03-25 14:47:18 · 504 阅读 · 0 评论 -
使用kmer的count结果构建numpy的array
在完成kmer生成的count后,汇总所有样本生成numpy array,用于机器学习的训练输入文件不同分类样本的kmer数据文件夹,本文是chrom和plas两类总的kmer listimport numpy as npimport globimport argparseimport pandas as pdparser = argparse.ArgumentParser(...原创 2019-12-17 01:19:46 · 376 阅读 · 0 评论 -
本地blast的使用及SRA转fastq,解决sra转换成fastq后bwa无法识别的问题
BLAST instaliiation直接下载编译好的balst,加入 PATH导入PATH,使其在任何terminal中均可使用export PATH=$PATH:your directory/ncbi-blast-2.9.0+/bincd ~vim ~/.bash_profilesource ~/.bash_profile使用命令建立数据库makeblastdb -in ...原创 2019-11-04 00:36:16 · 950 阅读 · 0 评论 -
二代数据序列QC,BWA,IGV可视化快速流程
1. Reads QC使用fastqc 软件参数:-t 线程数-o 输出文件夹名最后输入要质控的序列名字fastqc -o qc -t 15 S11.fastq# 使用prinseq-lit软件去除左端10bp,右端5bp,最低长度1000,输出到text.qc.fq中参数:-verbose 动态输入过程-fastq 输入文件格式和名字-trim_left 左...原创 2019-11-04 00:30:09 · 2419 阅读 · 0 评论