自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一台没有感情的知识吸尘器

做好知识分享,自己有限的力量能帮助到尽可能多的人。

  • 博客(17)
  • 收藏
  • 关注

原创 DataCamp课程 <高效率代码> Chapter2. R语言高效化基础

高效率代码课程目录Chapter1. BenchmarkingChapter2. R语言高效化基础Chapter3. 查看Code内部Chapter4. 多线程计算R语言其实本质就是一个脚本语言,和C不一样,没法控制内存。不好的指令会浪费很多内存。在R语言中为了实现高速效率化,有三大原则。1. 绝对不要增长向量(grow vector)比方说你自定义了一个属于向量增长的函数growing()n <- 30000# Slow codegrowing <- function(n)

2021-08-04 09:41:31 180

原创 DataCamp课程 <高效率代码> Chapter1. Benchmarking

高效率代码课程目录Chapter1. BenchmarkingChapter2. R语言高效化基础Chapter3. 查看Code内部Chapter4. 多线程计算查看R版本用version就可以,但是注意version不是一个函数。# Print the R version details using versionversion _ platform x86_64-pc-linux-gnu

2021-07-26 16:41:29 272

原创 DataCamp课程 <Tidyverse> Chapter.4 可视化类型

Tidyverse课程目录Chapter 1. 数据整形Chapter 2. 数据可视化Chapter 3. 分组和概括Chapter 4. 可视化类型Chapter.4 可视化类型这一章节会结合到之前说到的语法和知识。介绍几种最基础和常用的ggplot的图形。线图首先根据year对数据进行组化,然后用summarize计算出dgpPercap的中位数命名为变量medianGdpPercap。最后对每年的medianGdpPercap进行可视化画出线图library(gapminder)

2021-07-21 16:32:50 177

原创 DataCamp课程 <Tidyverse> Chapter.3 分组和概括

Tidyverse课程目录Chapter 1. 数据整形Chapter 2. 数据可视化Chapter 3. 分组和概括Chapter 4. 可视化类型Chapter 3. 分组和概括用summarize进行描述性统计summarize的功能就是对某个变量根据指定(比方说平均数,中位数)就行概述。举个例子,我们要看一下lifeExp的中位数。# Summarize to find the median life expectancygapminder %>% summarize

2021-07-20 12:40:02 421

原创 DataCamp课程 <Tidyverse> Chapter.2 数据可视化

Tidyverse课程目录Chapter 1. 数据整形Chapter 2. 数据可视化Chapter 3. 分组和概括Chapter 4. 可视化类型Chapter 2. 数据可视化这一章里会用到ggplot2包来可视化数据。数据的话和Chapter一样,用到了gapminder里的数据。首先运行一下本次会用到的三个包。ggplot2小试牛刀ggplot2的名声估计大家也早有耳闻,在这里做简单的入门介绍。之后会出专题详细讲解,功能之强大罄竹难书(用词不当)。# Load the ggpl

2021-07-08 16:46:55 176

原创 DataCamp课程 <Tidyverse> Chapter.1 数据整形

210707 CloudyTidyverse课程目录Chapter 1. 数据整形Chapter 2. 数据可视化Chapter 3. 分组和概括Chapter 4. 可视化类型Chapter 1. 数据整形Tidyverse的核心包如下:课程里会用到包gapminder里的数据。所以首先安装和运行一下包。# Load the gapminder packagelibrary(gapminder)# Load the dplyr packagelibrary(dplyr)再看

2021-07-07 14:10:18 208

原创 Shell脚本的基础以及常用指令

Shell 是什么其实在之前的文章里有略微提到过。生信分析中不可或缺的一个伙伴,不管你主打R还是Python,Shell是必修课。当然,Shell的指令相对而言比较简单,不需要太多的学习成本,看完本文大概可以解决90%的日常问题了。Shell的特点及用途和unix指令一样,输入指令然后执行就好指定什么时候按照什么条件用什么指令进行命令执行指定输入文件和输出文件基本设置首先用随便什么IDE创建一个最简单的Shell脚本文件,没有IDE的话可以新建一个txt文件,文件名后缀改成sh就好,比方说

2021-07-05 17:08:15 309

原创 如何获取公开数据库里的数据

1. 用代码获取数据当然下载数据的方式有多种多样,你可以用最原始的方法在数据库网站上点击下载,但是在不经意之间,电脑不仅帮你下载好了数据,还把原本压缩好的数据给自动解压缩了,原本小巧的压缩包瞬间变成了硬盘杀手。当然可以通过电脑上的设置来取消解压缩功能,但在服务器上下载数据的时候总不能通过网页点击了吧。你还准备在本地点击下载了再上传到服务器?!!1.1 curl的用法首先需要创建一个工作目录,然后cd到工作目录中。我是建立在桌面上的,大家随意。mkdir Bioinfocd /Users/jaso

2021-06-25 12:36:09 2301

原创 机器学习包carcet多线程

R里机器学习常用到的carcet包,其实可以实现多线程快速运行。在此把使用方法给总结一下。install.packages("doParallel") #安装多线程处理包install.packages("caret") #caret包library(doParallel)library(caret)接下来就是指定CPU线程数,如果不知道自己的CPU有几个线程,可以使用「detectCores()」来查看cl <- makePSOCKcluster(8) # 假设是8线程 reg

2021-06-25 12:35:06 208

原创 Learning R

正则表达: https://www.regular-expressions.info/quickstart.html0821第一章 简介(略)第二章 科学计算器2.2 数学运算符和向量要比较整数值是否相等要使用==,而不是=同理,不等就是!=> c(3,4-1,1+1,1+1+1)==3[1] TRUE TRUE FALSE TRUE> 1:3!=3:1[1] TRUE FALSE TRUE==还可以用来比较字符串2.4 特殊数字Inf,-In.

2021-06-25 12:33:42 267

原创 ggplot2数据分析与图形艺术(学习笔记)

0828https://github.com/hadley/ggplot2-bookChapter 2 Chapter 2 ggplot2 入门ggplot2图像的三个基本构成1.数据2.图形属性映射,设定变量如何射映到图层的图形属性上3.几何对象,至少一层,用于指定绘图所用的几何对象ggplot(mpg,aes(x = displ,y = hwy))+geom_point()ggplot(economics,aes(date,unemploy))+geom_line()

2021-06-25 12:31:46 646

原创 手把手R入门(学习笔记)

0618 15:00故事:Slot Machine八青哥https://rstudio-education.github.io/hopr/programs.html没有过维加斯体验的人对这个故事的理解会有点费力。比如说本人。一个机器玩一次会生成3个不同的图标组合。如果该图标组合符合中奖规则,就会赢钱。和21点和大转盘比起来,八青哥的赔率比较低,所以更受庄主欢迎。9 Programs写play ( )– 1 随机产生三个图案– 2 计算奖金随机产生三个图案的functiong.

2021-06-25 12:29:30 353

原创 主成分分析PCA For R

1.主成分分析原理翻了很多帖子没有一个可以直接看懂的,每个帖子的说法用词虽然略微不一样,切入点都差不多,感觉都是从一个地方抄过来稍加修改而已。特别是从协方差忽然就切入特征值特征向量,让数学门外汉摸不着头脑。参考书:<多変量解析II 主成分分析 理論とRによる演習>使用数据:mtcars关键词:1.协方差矩阵2.特征向量,特征值主成分分析的目的:很简单:降低维度(去噪)????将一组N维数据降成K维(K小于N)原始数据Z在主成分向量l上的投影X最大X=Z*l (Z已知

2021-06-05 17:13:21 316

原创 R语言 ggplot2 多图排列 Part(2)

本文将接着讲解ggplot2的多图排列的下半部分,通过其他方式排列组合多张ggplot2的图。除此以外还可以给图加上图层,让你的数据报告更加多姿多彩。整合多图我们可以把不同类型的图放在一起,比方说散点图和密度图。# 绘制散点图sp <- ggscatter(iris, x = "Sepal.Length", y = "Sepal.Width", color = "Species", palette = "jco", size

2021-06-01 20:13:33 1468

原创 R语言 ggplot2 多图排列 Part(1)

在写论文或者报告的时候,肯定会不可避免的遇到编辑多图成一个图的情况。其实方法可以有很多,比方说最笨的办法用PPT自己手动拖移,再高级一点的用PS软件。但是都很繁琐(笔者惭愧的表示这些方法都用过)。仔细想想,好不容易用ggplot2画出了至少看上去高上大的图,到头来还是要靠PPT排版,是不是心里会有些不甘心呢。如果和我一样选择是的小伙伴,那请继续往下看文章,肯定可以给你带来不一样的体验。本文使用到的包有gridExtra cowplot和ggpubr。通过阅读本文你可以学会以下技能,把所组不一样的图,表,

2021-05-25 20:47:17 1714

原创 Windows10下挂Linux子系统做生信分析

废话不多说,步骤如下开启母系统windows的WSLPS C:\Windows\System32> Enable-WindowsOptionalFeature -Online -FeatureName Microsoft-Windows-Subsystem-Linux然后会自动重启电脑去windows商店下载ubuntu在开始菜单里启动ubuntu,设置子系统的账号密码设置ssh-server,让子系统上线$ sudo ssh-keygen -Assh-key

2021-05-25 20:44:53 584 1

原创 生信分析常用编程语言汇总

0525 Cloudy说到编程语言,其实大致可以分成两种,一种是计算机编译器语言,比方说C,C++,优点在于基于计算机硬件特点编写,可以使代码有效高速的运行,特别适合大规模复杂的计算。日常用到的程序有很多,比方说其中之一就是大名鼎鼎的BLAST。还有一种是脚本语言,小到中等规模的计算和数据操作时会经常用到,这个时候用C可以说是用牛刀杀鸡。用编译器语言编写的工具绝大多数情况下除了需要参数设置以外都可以直接使用。比起编译器语言,生信分析中给我们带来阻碍更多的是脚本语言。当然也不是说每一个编程语言都需要用的风

2021-05-25 14:56:53 1862

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除