[置顶] python-multiprocessing 多进程并行计算

#16.6.1.1. The Process class from multiprocessing import Process import os import time start_time = time.time() def info(title): print(title) if hasattr(os, 'getppid'): # only available on...
阅读(3061) 评论(0)

[置顶] python 随机抽取Fastq文件

参考 http://pythonforbiologists.com/index.php/randomly-sampling-reads-from-a-fastq-file/最近要做一个二代测序的模拟,所以网上找了个小脚本,做了些注释,希望能够帮助大家。from __future__ import division import randomnumber_to_sample = 3000000 nu...
阅读(5448) 评论(0)

[置顶] R语言 并行处理

具体的不懂,只记录实现 parallel packageR自带的包,可以实现并行处理。library(parallel) detectCores(logical = F) #获得实际核数 cl <- makeCluster(getOption("cl.cores", 4)) # 设置并行核数为4 clusterExport(cl=cl, varlist=c("text.var", "ntv", "...
阅读(6905) 评论(0)

[置顶] R语言神器

R pacakgedplyr数据处理神器, plyr的升级版,主要用于数据框,可以实现与数据库的快速交互。data.table读取文件,处理数据,速度比python,dplyr还要快。 就是语法上有些凌乱。reshape2, tidyr揉数据的法宝,将数据以不同的形式展现,列数由多变少, tidyr 是 reshape2 的升级版,主要用于数据框。readr2015-04-09 readr 发布,同...
阅读(9799) 评论(0)

[置顶] R语言常用函数集合

meltmelt(data, id.vars, measure.vars, variable.name = "variable", ..., na.rm = FALSE, value.name = "value", factorsAsStrings = TRUE)id.vars 表示固定不变的列 measure.vars 控制变量,需要处理的列,将这些列名作为某一列的数值 variabl...
阅读(6813) 评论(0)

UCSC 人类参考基因组hg19数据下载

This directory contains a dump of the UCSC genome annotation database for the Feb. 2009 assembly of the human genome (hg19, GRCh37 Genome Reference Consortium Human Reference 37 (GCA_000001405.1)). T...
阅读(170) 评论(0)

一代、二代、三代测序技术原理与比较

从1977年第一代DNA测序技术(Sanger法)1,发展至今三十多年时间,测序技术已取得了相当大的发展,从第一代到第三代乃至第四代,测序读长从长到短,再从短到长。虽然就当前形势看来第二代短读长测序技术在全球测序市场上仍然占有着绝对的优势位置,但第三和第四代测序技术也已在这一两年的时间中快速发展着。测序技术的每一次变革,也都对基因组研究,疾病医疗研究,药物研发,育种等领域产生巨大的推动作用。在这里我主要对当前的测序技术以及它们的测序原理做一个简单的小结。...
阅读(251) 评论(0)

【error】pg_dump no matching tables were found

pg_dump 备份数据时,提示 no matching tables were found, 可是表明明是存在的。最后发现,是引号的问题,于是加了双引号,可还是不行。最终在Stack Overflow发现了答案。https://stackoverflow.com/questions/13905162/postgres-dump-specific-table-with-a-capital-lett...
阅读(718) 评论(1)

【error】postgresql relation does not exist

最近刚刚使用postgresql遇到很多问题。postgresql relation does not exist使用postgresql 查询 AAA 数据表时,提示 postgresql relation does not exist ,可是 SELECT tablename FROM pg_tables;AAA 表是存在的,好奇怪。搜索之后发现,是因为引号的问题。PostgreS...
阅读(741) 评论(0)

【error】No such file or directory apu-1-config apr-1-config

问题mac采用 pip3 install mod_wsgi, 报错FileNotFoundError: [Errno 2] No such file or directory: '/Applications/Xcode.app/Contents/Developer/Toolchains/OSX10.12.xctoolchain/usr/local/bin/apu-1-config'FileNotF...
阅读(1221) 评论(0)

error: Cannot find OpenSSL's <evp.h> Mac

问题mac安装php需要openssl./configure –with-openssl报错 error: Cannot find OpenSSL’s 解决brew install openssl ./configure --with-openssl=/usr/local/Cellar/openssl/1.0.2l/...
阅读(1301) 评论(0)

【跟着stackoverflow学Pandas】--Converting a Pandas GroupBy object to DataFrame-Groupby对象转换为DataFrame

我们在对数据进行清洗时,经常要用到split-apply-combine,首先对数据按照一定的标准进行split(分组),然后对每组数据进行apply(处理),最后把结果combine(合并),在这一系列操作中就必须要用到 pandas的groupby函数。...
阅读(1986) 评论(0)

【R】R语言指定包安装目录

仅针对Linux操作系统。查看R安装目录R # 进入R软件 .libPaths()方法1 在 ~/.bashrc 中设置export R_LIBS_USER=/your/path然后采用 install.packages("ggplot2", repos='http://cran.rstudio.com/') 即可将包安装在自己制定的 /your/path 这样做的优点是别人source你的环境...
阅读(2410) 评论(0)

【perl】cpan 非root安装perl模块

处于无奈才用perl的,相比python,不喜欢perl。。。以下写入你的 .bashrc 或 .zshrc 文件,然后sourcesoftware=/your/path#cpan install export PERL_LOCAL_LIB_ROOT="${software}/PERL5" export PERL_MB_OPT="--install_base ${software}/PERL5" e...
阅读(2450) 评论(0)

【python-tips】非root权限安装pip、其他包

很多时候我们拿到服务器的账号,只是一个普通用户,没有root权限,这没有关系。关键是没有pip、没有必要的python包。参考Stack Overflow给出解决方案,适用于python2.7, python3.x安装pipwget https://raw.github.com/pypa/pip/master/contrib/get-pip.py python get-pip.py --user这里...
阅读(2746) 评论(0)

【跟着stackoverflow学Pandas】- apply、applymap、map 三者使用差异

## Difference between map, applymap and apply methods in Pandas - map、apply、applymap 三者使用差异 https://stackoverflow.com/questions/19798153/difference-between-map-applymap-and-apply-methods-in-pandas...
阅读(2954) 评论(0)

【跟着stackoverflow学Pandas】-How do I get the row count of a Pandas dataframe-获取DataFrame行数

最近做一个系列博客,跟着stackoverflow学Pandas。专栏地址:http://blog.csdn.net/column/details/16726.html以 pandas作为关键词,在stackoverflow中进行搜索,随后安照 votes 数目进行排序: https://stackoverflow.com/questions/tagged/pandas?sort=votes&p...
阅读(2816) 评论(0)

【跟着stackoverflow学Pandas】- 删除带有NaN的行

最近做一个系列博客,跟着stackoverflow学Pandas。 专栏地址:http://blog.csdn.net/column/details/16726.html以 pandas作为关键词,在stackoverflow中进行搜索,随后安照 votes 数目进行排序: https://stackoverflow.com/questions/tagged/pandas?sort=votes&...
阅读(3242) 评论(0)

【跟着stackoverflow学Pandas】 - Pandas: change data type of columns - Pandas修改列的类型

Pandas: change data type of columns - Pandas修改列的类型...
阅读(3140) 评论(0)
96条 共7页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:668432次
    • 积分:6456
    • 等级:
    • 排名:第4135名
    • 原创:72篇
    • 转载:13篇
    • 译文:11篇
    • 评论:32条
    博客专栏
    文章分类
    最新评论