[置顶] python-multiprocessing 多进程并行计算

#16.6.1.1. The Process class from multiprocessing import Process import os import time start_time = time.time() def info(title): print(title) if hasattr(os, 'getppid'): # only available on...
阅读(1552) 评论(0)

[置顶] python 随机抽取Fastq文件

参考 http://pythonforbiologists.com/index.php/randomly-sampling-reads-from-a-fastq-file/最近要做一个二代测序的模拟,所以网上找了个小脚本,做了些注释,希望能够帮助大家。from __future__ import division import randomnumber_to_sample = 3000000 nu...
阅读(3875) 评论(0)

[置顶] R语言 并行处理

具体的不懂,只记录实现 parallel packageR自带的包,可以实现并行处理。library(parallel) detectCores(logical = F) #获得实际核数 cl <- makeCluster(getOption("cl.cores", 4)) # 设置并行核数为4 clusterExport(cl=cl, varlist=c("text.var", "ntv", "...
阅读(5256) 评论(0)

[置顶] R语言神器

R pacakgedplyr数据处理神器, plyr的升级版,主要用于数据框,可以实现与数据库的快速交互。data.table读取文件,处理数据,速度比python,dplyr还要快。 就是语法上有些凌乱。reshape2, tidyr揉数据的法宝,将数据以不同的形式展现,列数由多变少, tidyr 是 reshape2 的升级版,主要用于数据框。readr2015-04-09 readr 发布,同...
阅读(8005) 评论(0)

[置顶] R语言常用函数集合

meltmelt(data, id.vars, measure.vars, variable.name = "variable", ..., na.rm = FALSE, value.name = "value", factorsAsStrings = TRUE)id.vars 表示固定不变的列 measure.vars 控制变量,需要处理的列,将这些列名作为某一列的数值 variabl...
阅读(5088) 评论(0)

【跟着stackoverflow学Pandas】--Converting a Pandas GroupBy object to DataFrame-Groupby对象转换为DataFrame

我们在对数据进行清洗时,经常要用到split-apply-combine,首先对数据按照一定的标准进行split(分组),然后对每组数据进行apply(处理),最后把结果combine(合并),在这一系列操作中就必须要用到 pandas的groupby函数。...
阅读(452) 评论(0)

【R】R语言指定包安装目录

仅针对Linux操作系统。查看R安装目录R # 进入R软件 .libPaths()方法1 在 ~/.bashrc 中设置export R_LIBS_USER=/your/path然后采用 install.packages("ggplot2", repos='http://cran.rstudio.com/') 即可将包安装在自己制定的 /your/path 这样做的优点是别人source你的环境...
阅读(858) 评论(0)

【perl】cpan 非root安装perl模块

处于无奈才用perl的,相比python,不喜欢perl。。。以下写入你的 .bashrc 或 .zshrc 文件,然后sourcesoftware=/your/path#cpan install export PERL_LOCAL_LIB_ROOT="${software}/PERL5" export PERL_MB_OPT="--install_base ${software}/PERL5" e...
阅读(916) 评论(0)

【python-tips】非root权限安装pip、其他包

很多时候我们拿到服务器的账号,只是一个普通用户,没有root权限,这没有关系。关键是没有pip、没有必要的python包。参考Stack Overflow给出解决方案,适用于python2.7, python3.x安装pipwget https://raw.github.com/pypa/pip/master/contrib/get-pip.py python get-pip.py --user这里...
阅读(995) 评论(0)

【跟着stackoverflow学Pandas】- apply、applymap、map 三者使用差异

## Difference between map, applymap and apply methods in Pandas - map、apply、applymap 三者使用差异 https://stackoverflow.com/questions/19798153/difference-between-map-applymap-and-apply-methods-in-pandas...
阅读(1386) 评论(0)

【跟着stackoverflow学Pandas】-How do I get the row count of a Pandas dataframe-获取DataFrame行数

最近做一个系列博客,跟着stackoverflow学Pandas。专栏地址:http://blog.csdn.net/column/details/16726.html以 pandas作为关键词,在stackoverflow中进行搜索,随后安照 votes 数目进行排序: https://stackoverflow.com/questions/tagged/pandas?sort=votes&p...
阅读(1324) 评论(0)

ggplot2-分面(facet) 一页多图

ggplot2的数据分面就是根据数据中的不同分组,绘制多个图形....
阅读(7951) 评论(0)

ggplot2-为图形添加直线

ggplot2 为图形添加直线...
阅读(9957) 评论(0)

ggplot2-设置图例(legend)

本文更新地址:http://blog.csdn.net/tanzuozhev/article/details/51106909本文在 http://www.cookbook-r.com/Graphs/Scatterplots_(ggplot2)/ 的基础上加入了自己的理解图例用来解释图中的各种含义,比如颜色,形状,大小等等, 在ggplot2中aes中的参数(x, y 除外)基本都会生成图例来解释...
阅读(16346) 评论(0)

ggplot2-设置坐标轴

本文在 http://www.cookbook-r.com/Graphs/Axes_(ggplot2)/ 的基础上加入了自己的理解基本箱线图library(ggplot2) bp ggplot(PlantGrowth, aes(x=group, y=weight)) +...
阅读(15417) 评论(0)

ggplot2-绘制散点图

ggplot2 绘制散点图...
阅读(8310) 评论(0)

ggplot2–绘制分布图

ggplot2–绘制分布图本文更新地址:本文在 http://www.cookbook-r.com/Graphs/Plotting_distributions_(ggplot2)/ 的基础上加入了自己的理解生成绘图数据set.seed(1234) dat data.frame(cond = factor(rep(c("A","B"), each=200)),...
阅读(8831) 评论(0)

ggplot2-为折线图和条形图添加误差线

采用ggplot2绘制折线图和条形图,并添加误差线.ggplot2只能处理 data.frame数据,每列作为一个变量,是一个指标.以ToothGrowth数据为例,进行处理tg ToothGrowth head(tg)## len supp dose ## 1 4.2 VC 0.5 ## 2 11.5 VC 0.5 ## 3 7.3 VC 0.5 ## 4 5.8...
阅读(11311) 评论(1)

ggplot2 保存图片 字体不协调

在使用R语言ggplot2 package画图时,导出图片总会遇到标题字体与图片不协调的情况,下面提出一种解决方案library(Cairo) library(ggplot2) p <- ggplot(mtcars, aes(factor(cyl))) # By default, uses stat="bin", which gives the count in each category p <-...
阅读(4681) 评论(0)

ggplot2 左右两个y轴

两个ggplot 图合并到一起,一个x轴两个y轴raw_data <- read_delim('./data/GO_pathway.txt', delim = '\t') head(raw_data) library(dplyr) library(Cairo)double_y_axis <- function(p1, p2){ g1 <- ggplot_gtable(ggplot_build(p...
阅读(4462) 评论(0)
90条 共6页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:535284次
    • 积分:5550
    • 等级:
    • 排名:第4960名
    • 原创:68篇
    • 转载:11篇
    • 译文:11篇
    • 评论:29条
    博客专栏
    文章分类
    最新评论