自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

转载 Cmd Markdown 公式指导手册

转载自https://github.com/Crzq/SpaceX/blob/main/Cmd%20Markdown%20%E5%85%AC%E5%BC%8F%E6%8C%87%E5%AF%BC%E6%89%8B%E5%86%8C.md本文为 MathJax 在 Cmd Markdown 环境下的常用语法指引。Cmd Markdown 编辑阅读器支持 LaTeX\LaTeXLATE​X 编辑显示支持,例如:∑i=1nai=0\sum_{i=1}^n a_i=0∑i=1n​ai​=0,访问 MathJa

2023-11-24 20:39:22 167

原创 如何在命令行下快速压缩 pdf 文件?

用 ghostscript 的 gs 命令一行搞定gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook \-dNOPAUSE -dBATCH -dColorImageResolution=150 \-sOutputFile=output.pdf someBigFile.pdf参考链接https://opensource.com/article/20/8/reduce-pdf...

2022-03-01 14:31:59 772

原创 两个 0 1 向量之间的相关性计算

本文主要思想来自https://www.cnblogs.com/dan-baishucaizi/p/10096316.html假设 a\bf aa、b\bf bb 两个 0 1 向量a= (x1,x2,⋯ ,xn),其中xi∈{0,1}b= (y1,y2,⋯ ,yn),其中yi∈{0,1}\begin{aligned}\bf{a} =& \ (x_1, x_2, \cdots, x_n), 其中 x_i \in \lbrace 0, 1 \rbrace \\\bf{

2022-01-15 16:45:08 1269

原创 MacOS 下 Emacs 安装及 ESS 配置

安装 Emacs在这里下载 Emacs 安装https://emacsformacosx.com/安装完成后,emacs 的可执行文件路径是/Applications/Emacs.app/Contents/MacOS/Emacs 执行如下操作mkdir $HOME/bincd $HOME/binln -s /Applications/Emacs.app/Contents/MacOS/Emacs emacs修改 .profile 文件,将 $HOME/bin 目录添加到 PATH 中

2022-01-14 20:28:37 1067

原创 矩阵运算规律总结

矩阵运算规律总结矩阵相乘结合律A(BC)=(AB)CA(BC)=(AB)CA(BC)=(AB)C矩阵相乘交换律A(B+C)=AB+AC(A+B)C=AC+BCA(B+C) = AB + AC \\(A+B)C = AC + BCA(B+C)=AB+AC(A+B)C=AC+BC矩阵的逆设 AAA 为方阵,如果存在方阵 A−1A^{-1}A−1 使得AA−1=A−1A=IAA^{-1} = A^{-1}A = IAA−1=A−1A=I则方阵 AAA 可逆,A−1A^{-1}A−1

2021-12-23 21:34:10 7024

原创 按照 Ubuntu 官方的方式来设置 DNS

绝大多数的 Linux 发行版都是在 /etc/resolv.conf 文件中设置 DNS 服务器,然而到了 Ubuntu 这里,这个方法不 work 了。即使强行手动修改这个文件,系统仍然会自动恢复到如下的默认设置。# This file is managed by man:systemd-resolved(8). Do not edit.## This is a dynamic resolv.conf file for connecting local clients to the# inter

2021-01-27 21:52:02 808

原创 如何创建使用 sbt 管理的 spark 项目?

为了方便大家使用,我在 github 上创建了一个 spark 骨架项目,在 bash 环境中运行git clone https://github.com/klcola/spark-skel.git testskel即可在当前目录下创建名称为 testskel 的项目文件夹。你可以将 testskel 替换成你自己的项目文件夹名。你可以随后用 IDEA 或者其他常用的编程工具打开这个文件夹开始编写程序。也可以直接访问 https://github.com/klcola/spark-skel 查看更详

2021-01-16 18:05:33 159

原创 利用 sbt 创建 scala 项目

利用 sbt 命令行可以创建一个 scala 模板项目,该命令为sbt new scala/scala-seed.g8sbt 会自动下载项目模板,并提升用户输入自定义的项目名称,非常简单。

2021-01-15 11:15:00 371

原创 如何用 scala 调用外部命令、重定向及使用管道?

太长不看版在 scala 中调用外部命令行程序非常简单,只需要导入 sys.process 包,并在需要调用的命令行外加双引号,并在行尾加 ! 号,如果想获得标准输出,就在行尾加 !! 号,如果需要管道或者重定向,请使用 #| 或者 #> 操作符,并注意在 #> 后面不能直接加文件名,需要使用 java.io.File 对象。举例:// 导入需要的依赖import sys.process._import java.io.File// 执行 ls -la 并且获取 exit code

2020-12-10 16:42:49 1135

原创 在 Ubuntu Linux 系统中安装软件时如何指定版本号

ubuntu 系统官方的软件仓库一般会为某个软件提供几种版本供用户选择安装,如果不指定版本号,系统会默认选择最新的稳定版进行安装。但工作中经常会因为兼容性的问题,需要我们安装某个软件的具体版本,这个时候该如何操作呢?首先,我们可以查看系统中某个软件都提供了哪些版本可供安装,这可以利用 apt-cache madison 命令来实现,废话不多说,直接看 bash 命令行代码$ apt-cache madison r-base r-base | 4.0.2-1.1804.0 | https://cl

2020-09-13 16:20:27 5473 2

原创 如何查看已安装的 Ubuntu Linux 的版本号?

在安装有些软件的时候,需要根据 ubuntu 具体的版本号来下载指定的软件版本,那么怎么才能知道自己在用的 ubuntu 系统是哪一个版本呢?用系统自带的 lsb_release 命令,就可以查看正在使用的 ubuntu 系统的版本号。例如$ lsb_release -aNo LSB modules are available.Distributor ID: UbuntuDescription: Ubuntu 18.04.4 LTSRelease: 18.04Codename

2020-09-11 15:08:23 1866

原创 利用 ggplot2 绘制 Seurat 对象中的 tSNE 或 UMAP 图

Seurat 软件自带的绘图函数 DimPlot 虽然也提供了一些参数来供我们调整图形,但有时仍然有些你希望的功能不太容易实现,比如将细胞聚类分成三组,每一组是一种颜色,利用 DimPlot 就不容易实现(步骤比较繁琐:需要给细胞的 meta.data 增加额外的分组标识列,然后用 group.by 参数来为不同的分组上色)。一种更灵活的方法是把 tSNE 或者 UMAP 降维的信息从 seurat 对象中提取出来,并利用 ggplot 作图。具体代码如下:## 假设我们有 Seurat 对象存储在 s

2020-08-21 15:51:22 11401 2

原创 如何根据 ID 快速从 fastq 文件中提取序列

第一种方法:使用 grep -A 选项第一种方式比较简单,用 Linux 系统自带的 grep 命令就可以实现。grep 的 -A NUM 选项在匹配行之后打印尾随的 NUM 行,而 fastq 格式恰好是 4 行代表一个序列,第一行是序列 ID,随后三行分别是序列、+号分隔符、碱基质量分数,因此我们用 grep -A3 选项,就可以将匹配到的序列 ID 和该 ID 对应的其他信息提取出来。举例如下:bash$ grep -A3 '@A00821:376:H3V2LDSXY:3:1101:12753:3

2020-08-08 13:46:46 10901 1

原创 Ubuntu 系统下安装支持 GPU 的 tensorflow 和 keras

安装 tensorflow 前,需要先安装 NVIDIA 驱动,cuda 和 libcudnn 库。注意 tensorflow 对 cuda 版本要求比较严格,目前是需要 cuda10.1,如果安装了其他版本,tensorflow 会报找不到 cuda 动态链接库的错误。亲测根据以下 bash 命令行安装所需要的驱动和 cuda 库,能够正常工作。安装命令行来自 https://tensorfl...

2020-05-04 10:40:22 286

原创 如何只用 Linux 命令行来随机抽取文本数据文件的 N 行?

一句话读完版:假设从 data.txt 中随机抽取 100 行,使用如下命令shuf data.txt | head -100正文在进行机器学习或者深度学习工作的时候,我们有时希望从一个大数据文件中随机抽取一些记录来进行一些快速的预研,无须编程,仅仅用一条 Linux 命令行就可以实现我们的目的。首先来看一个例子,假设我们有数据文件 test.txt ,其内容如下11111111...

2020-04-30 23:17:25 3046

原创 浅谈局部线性嵌入(LLE)的数学原理

Nonlinear Dimensionality Reduction by Locally Linear Embedding简介局部线性嵌入(LLE)利用非监督学习方法来将高维网络数据嵌入到低维空间中,并在该低维空间中保留网络节点间的邻域信息。区别于局部降维的聚类方法,LLE将网络节点映射到一个统一的低维空间坐标系统中,并且该方法的优化不依赖局部最小值。利用线性重构的局部对称性,LLE 能够学...

2020-04-09 18:51:08 960

原创 瑞利商(Rayleigh Quotient)及瑞利定理(Rayleigh-Ritz theorem)的证明

https://www.planetmath.org/RayleighRitzTheorem瑞利商(Rayleigh quotient)厄米特矩阵(Hermitian Matrix)复平面(Complex Plane)考虑形如 a+bia+bia+bi 的复数,该数代表复平面上的一个点。复平面中 xxx 轴代表实数部分,yyy 轴代表虚数部分,这样 a+bia+bia+bi 在复平面上就代...

2020-04-09 18:40:53 26073 5

原创 浅谈拉格朗日乘子法的数学推导

注 数学系列为本人的学习笔记,水平有限,如有错误希望读者不吝指正。拉格朗日乘子法(Lagrange Multiplier Method)是求解最优化问题的一个方法,在推导该方法之前,先来看几个基本概念。梯度(gradient)函数的梯度是由该函数的偏导数组成的向量,一元函数的梯度就是导数,函数的切线就是梯度的方向,二元函数的梯度是两个偏导数组成的向量,例如二元函数 z=f(x,y)z=f(x...

2020-04-09 18:02:28 2219

原创 R 中如何对 data.frame 中的数字进行格式化?

使用 R 语言内置的 format() 函数请注意,format() 函数是个泛型函数(generic function),该函数默认是针对 list 类型的。比如:> x2 <- c(0, 0.1, 0.12, 0.123, 0.1234)> format(x2, digits = 3)[1] "0.000" "0.100" "0.120" "0.123" "0.123...

2020-02-13 18:50:50 926

原创 R install.packages 如何从源代码包安装?

很简单,示例代码如下install.packages("/home/klcola/Matrix.utils_0.9.7.tar.gz", repos = NULL, type="source")

2020-02-11 12:01:14 3784 2

原创 Ubuntu 下 vim 如何对编程语言进行高亮显示?

只需安装 vim-syntastic 就可以,命令行如下:# 首先切换成 root 用户apt-get updateapt-get install vim-syntastic

2020-02-02 11:06:09 401

翻译 理解如何利用偏序比对法进行多序列比对

本文翻译自 Understanding Partial Order Alignment for Multiple Sequence Alignment,原文链接在http://simpsonlab.github.io/2015/05/01/understanding-poa/Jared 开发的 Nanopolish 工具使用 poaV2 工具来对测序序列进行错误修正,poaV2 则使用了偏...

2020-01-22 20:52:13 3225 6

原创 如何根据染色体坐标快速得到基因组的 DNA 序列

http://pythonhosted.org/twobitreader/ 提供了一个方便的小工具python -m twobitreader hg19.2bit < example.bed染色体的位置信息在 bed 文件中给出,.2bit 文件格式是 UCSC Genome Browser 的基因组序列文件索引格式,可以在 http://hgdownload.soe.ucsc.edu...

2020-01-18 17:35:03 9981

原创 共有序列(Consensus Sequence)

共有序列(Consensus Sequence)的概念用来描述一组 DNA 或者蛋白质序列,通常这组序列互相之间非常相似但又不完全相同,共有序列就由这组相似序列中每个位置最常出现的碱基或者氨基酸组成。...

2020-01-18 13:57:25 8963 1

原创 R 语言中如何调整 matrix 和 dataframe 中列的顺序

生物信息工作的一大苦恼就是经常需要在各种语言之间切换,Java、Bash、R、Python、C/C++、Perl,甚至还有 H/ML5/CSS/Javascript,有些常用,有些隔数月乃至数年用到一次。以至于经常是逻辑上知道一个事情该怎么做,一个功能该怎么实现,却发现找不到合适的 API。尤其是 R 语言,由于和 Java/Python 这样的传统编程语言面向的主要应用场景不同,导致做同样事情的...

2019-12-30 15:19:50 20070

原创 如何用 bash 命令将 fastq 转换为 fasta 格式文件?

能点进来看的都是同行,文件格式就不多说了,直接上命令行grep '^@' -A1 file.fastq | grep -v -- '--' | awk '{print $1}' | sed -e 's/@/>/' > file.fa上面的命令在 fasta 文件的 id 行里只保留了序列 id。如果想在 fasta 文件的 id 行里保留其他信息,可以去掉 awk '{print...

2019-12-26 10:58:23 1539

原创 谈谈 Scala 函数参数列表中的 => 符号

在 Scala 函数定义通常有两种,一种是def f(x: R)为传值调用(Call-by-value)。另一种是def f(x: => R)为传名调用(Call-by-name)。这两者的区别在于,传值调用在进入函数 f 之前,x 的值就已经被计算出来,而传名调用则会等到进入函数 f 内部,执行到有 x 参与的语句时,才计算 x 的值。举例说明,在 Linux bash ...

2019-09-26 22:51:59 251

原创 MariaDB/MySQL 如何在数据库之间复制表结构

在项目开发过程中进行新功能测试时,时常会需要把生产环境中的数据库结构复制一份到测试数据库中,MariaDB/MySQL 提供了方便的 SQL 语句可以做到这一点。1. 仅复制表结构不复制数据假设在同一个数据库系统中,生产环境下的数据库名为 product,我们新创建的测试数据库名为 devp,现在需要把 product 数据库中名为 ppi 的表结构复制到 devp 中但不复制数据,SQL 语...

2019-09-05 17:51:12 956

原创 如何利用 sbt 运行 Scala REPL

刚开始学习 Scala 时,有一个很大的疑问,就是在 Scala 的官方下载页面(https://www.scala-lang.org/download/),仅仅提示用户可以通过 INTELLJ 或 sbt 来管理和编译 Scala 项目,并没有直接提供 Scala 运行环境的下载。但是对于初学者用户来说,其实最需要的是一个交互式编程环境( REPL 1 ),可以直接拿来就跑教程上的示例语句,而不...

2019-08-16 12:12:03 728

原创 scala 中的 sealed trait

声明为 sealed 的 trait 只能被同一个文件内的 class 继承。sealed 关键字可以方便 scala 编程中模式匹配方法的使用,使用 sealed 关键字修饰的 trait 和相应的被 case 修饰的子类,类似其他语言中的 enums 类型的作用。由于 sealed trait 的所有子类都被封装在一个文件中,编译器就可以知道该 trait 的所有子类,从而在进行模式匹配时进行...

2019-08-11 13:10:13 1489

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除