![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
bioinformatic
文章平均质量分 68
baker00
这个作者很懒,什么都没留下…
展开
-
practice1的一些问题
这次的数据处理,在开始之前就遇到不少问题。现在记录下来:首先是装几个软件,samtools需要make一下,但是都说是make一下,怎么是make一下呢。就是解压后,cd进入samtools文件夹,没有samtools这个可执行文件,然后输入make samtools 就这样。可能我比较脑残,弄了10多分钟才想出来。然后把samtools ,bowtie, bowtie-build, bo原创 2015-01-04 12:57:39 · 2822 阅读 · 0 评论 -
生信作业php连接mysql,再比对两条序列(1)
生信的课后练习,发现助教留的代码很有问题,mysql插入表都有问题。 解决的第一部分是序列比对的东西,还是针对的序列本身,很简单,不过第一次用php写,贴上来。<?phpfunction gap_insert(&$str,$i,$length){ for($j=$length;$j>$i;$j--) { $str[$j]=$str[$j-1]; } $str[$i]='-';原创 2015-03-21 20:47:15 · 567 阅读 · 0 评论 -
超算上安装python+HTSeq+numpy+easy_install
之前用tophat+cufflinks 算了RNA-seq差异表达,想用DESeq试下。查的protocol是要用HTSeq处理map的结果,也就是count reads。但是HTSeq是一个python的包,需要numpy,没有root权限,半天搞不好。记录下:1.下载HTSeq下载传到主机上,python setup.py build 出错。2.直接非root权限安装一个p原创 2015-08-25 13:47:34 · 5809 阅读 · 0 评论 -
python 提取文件指定列
之前用featureCount 处理得到结果,要提出第一列gene_id 和 readcount 列,首先软件输出的第一行默认是你使用的命令行,没有用,用bash批量删掉。for i in `ls`;do sed -i '1d' $i;done删除当前文件夹下所有文件第一行。其实提出两列很简单,不过我受够了每次一个文件执行一次的烦。想搞成别的程序调用时命令行参数直接就行。第一次知道sy原创 2015-08-26 21:53:37 · 21580 阅读 · 1 评论 -
将 paired count 和unpaired count 相加
尝试 count-based 算表达量过后,因为在map这一步一直是把过滤过后的paired 和unpaired reads 一起做的,后面count的时候就要出问题。发现可以用 samtools 从 bam 里分出来,于是就分开count,最后把reads 数相加。在用DESeq什么的。首先,记下 samtools 命令samtools view -bf -1 all.bam > pa原创 2015-08-31 13:02:59 · 676 阅读 · 0 评论 -
统计个数
in 文件每行有三列,tab分隔,统计最后一列每个字符出现的字数,其实是数字,但是当作字符处理。没什么问题,主要是最后想要对dict 按key值排序出了问题,python3 的dict不能用sort 什么的,最后也只能搞成按字符排序,而不是按key的数值排序。摘抄一段python 文档>>> # regular unsorted dictionary>>> d = {'banana'原创 2015-08-20 15:34:21 · 448 阅读 · 0 评论