数据处理
文章平均质量分 58
Chipeyown
这个作者很懒,什么都没留下…
展开
-
计算基因组覆盖度
计算覆盖度原创 2022-11-22 20:13:58 · 1046 阅读 · 0 评论 -
matplotlib作图系列之内置颜色使用(一)
matplotlib 部分内置颜色介绍在作图时,很多时候图省事,颜色选项就让程序自己选择了,下面是程序默认的颜色:但其实,matplotlib程序中,还是内置了不少漂亮的颜色搭配可供选择的:但是这些颜色怎么使用,网上的教程并不多。自己也是实际使用的时候,折腾了好久,才算是了解了一些简单的用法,所以码下来,防止下次使用时再去头疼。内置颜色的使用方法很多时候设定颜色,会直接设定一个数组,例如:colors=['grey','lightskyblue','springgreen']以扇形图为例原创 2021-12-21 22:26:55 · 5999 阅读 · 0 评论 -
python 多进程队列批量处理数据
问题做生信分析时,会遇到很多样品需要用同一个脚本去分析的情况。这些脚本除了样本名字需要更改,其他的都一样。有时候就会遇到这样的尴尬情况:(1)如果这些样品一次性提交,然后在后台一个一个的依次分析比较费时间。(2)如果同时把这些样品全部分析,服务器又带不动。(3)每次同时分析3个,结束了再提交3个,这个样子就会一直在忙着查看程序进程及提交新的程序,非常累。用一个比较容易理解的例子来讲就是:服务器出了一系列bug。如果只招一个程序员,一个一个的去修改,太慢了。如果招上和bug数量相等的程序员,每人解决原创 2021-10-04 21:03:09 · 1406 阅读 · 2 评论 -
python pandas读取或写入文件
pandas 读取文件pandas读取文件常用方法有:函数说明read_csv读取csv文件,默认分割符号为逗号read_excel读取xlsx文件,默认分割符号为空格read_table可读取常见的各种文本文件,默认分隔符为’\t’read_clipboard从粘贴板上读取数据这些命令的用法和R语言上面的风格很相似。pandas读取exc...原创 2019-04-13 15:40:02 · 4994 阅读 · 1 评论 -
plt作图推荐
plt作图做subplot及各种基础https://www.jianshu.com/p/da385a35f68dplt字体属性详解https://zhuanlan.zhihu.com/p/32150177plt绘制带有误差线的条形图https://blog.csdn.net/songyunli1111/article/details/83625639...原创 2020-03-29 21:31:20 · 202 阅读 · 0 评论 -
pandas合并dataframe之merge,join,append,concat方法
pandas合并df的方法pandas合并文件共有四种方法,分别是merge, append,join与concatmerge与join处理df的效果类似,可以用来根据特定列取交、并、补集,一个特殊的用法就是对表格进行注释。append合并df更体现在两个完全平行独立的表格的合并。例如:将一个表格写到另一个表格下面或者右面等。concat的用法,不懂啊。。merge的用法merge函数...原创 2019-12-18 12:40:00 · 1007 阅读 · 0 评论 -
pandas重新设置索引
pandas索引的重新设置重新设置索引有三种方法reset_index,set_index以及reindex常用的是前两种reset_index: 重新设置索引列,索引为: [0,1,2,3,4,5,6…]set_index: 可以设置特定列为索引首先,构建dataframeimport pandas as pdd={'gene':{'a':'gene1','b':'gene2',...原创 2019-12-18 10:52:25 · 21537 阅读 · 0 评论 -
pandas str方法的使用
pandas的str方法pandas特定的列经过str之后,就可以使用各种python常用的字符处理方法了。首先,构建dataframe:import pandas as pdd={'gene':{'a':'gene1','b':'gene2','c':'gene3','d':'gene4'},'expression':{'a':'low:0','b':'mid:3','c':'mid:4...原创 2019-12-17 12:34:37 · 13731 阅读 · 0 评论 -
pandas计算行或者列的总和及apply函数的使用
apply 赋予了pandas非常高灵活性。特别是配合上lambda函数之后,可以简化很多程序。特别是以行或者列处理问题的时候,非常方便简单使用首先,构建一个dataframeimport pandas as pdd={'one':{'a':1,'b':2,'c':3,'d':4},'two':{'a':5,'b':6,'c':7,'d':8},'three':{'a':9,'b':10,...原创 2019-12-03 19:31:46 · 14257 阅读 · 0 评论 -
下载sra原始数据(包含储存在sra-sos的数据)
对于一个做生信分析的学生,从NCBI上下载原始的测序文件是一项基本技能。sra文件可以理解为是fastq的压缩文件。sra文件可以通过SRA Toolkit软件包下载。但是实际上,我尝试了无数次,aspera也装了,但都不能下载。但是sra toolkit的软件包还是要装的,因为之后需要用其中的fastq-dump把sra转换成fastq文件。获取想要的data的SRR号发表的文章后面都是......原创 2019-06-22 14:31:21 · 13516 阅读 · 23 评论