生信分析对计算机的开发环境有诸多要求,随之而来的自然就是很多麻烦。不说别的,要兼顾 Python 和 R 的问题就有够头疼。一边想着用 Python 搭流程处理文本和分析结果,另一边还想着用 R 来做统计分析和画图,而且大多数时候生信分析还得在服务器上完成。
Python 你用 Pycharm,R 用 Rstudio,一会这儿一会那儿的切来切去,还得设置服务器连接(Pycharm 如果不是付费版本,要连服务器还挺麻烦)。完了在 Windows 下你还得用 Xshell 连服务器开个命令行执行脚本和 Shell 命令 ;上传下载文件再开个 Filezila;数据表格结果用 Excel 查看;PDF 用 Adobe Reader ... 有人会说哪有这么麻烦,用 Vscode 加插件就能解决~ 确实是不错的选择,可要换了台电脑之前的环境不就全废了么。
有了 JupyterLab 之后,只要能连上服务器,一个窗口内完美实现所有这些功能,而你需要的就只有一个软件:浏览器(最好是 Chrome)
看看效果:
同时打开了 Python Notebook、CSV数据表、PDF 文献、命令行和文件管理
Markdown 文件预览和图片预览
强大到令人咋舌(感觉两张截图还是不足以体现 JupyterLab 的强大 *_* )。不仅能直接查看分析时常用的多种数据和文件格式,Jupyter 的 notebook 在运行之后即时返回结果,非常方便做数据分析和可视化。我原来也用 Atom + MobaXterm + Filezila 的组合来写代码加做分析,自从不久前试用了 JupyterLab 之后,于是渐渐抛弃“原配”,投入 JupyterLab 的怀抱。
安利完了进入正题,从头开始搭建一个以 JupyterLab 为核心的生物信息分析环境,特别适用于各种服务器和云,当然在本地计算机上使用也可以。
搭建环境:
硬件平台:易微升服务器
操作系统:Ubuntu 18.04 LTS
*** 此段可跳过,不影响后文阅读 ***
注:这里选用 Ubuntu 系统,是因为个人习惯。在安装软件和各种环境的时候,apt 非常方便,而且默认仓库的软件版本都比较新,出现问题好解决一些。其他常见的类 Unix 系统,比如 CentOS(也是 Linux 内核),或者苹果的 MacOS,在搭建 Bioconda + Jup