自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 【PRML】第一章绪论学习笔记

第一章 绪论1. 模式识别问题与机器学习问题例子: 手写数字识别 --> 分类问题 --> y=f(x) --> y 属于[0,9]之间2.基本概念训练集:由N个数字{x1,x2,...xN}组成的大的集合测试集:新的目标集泛化:正确分类与训练集不同的新样本的能力有监督学习:训练数据的样本包含输入向量以及对应的目标向量的应用叫有监督学习分类:如果目标变量只能去离

2016-11-08 16:13:56 1025

转载 Python中的swap函数

问:Python中为什么没有swap(a, b)方法?我们在Python中如何交换对象?Python 不使用这种方式(swap(a, b))。Python以引用方式管理对象,你可以交换引用,但通常不能交换内存中的对象值。当然你也不需要这样做。在C++中这种函数用来交换“a和b的值”。在Python中,a和b的值不会发生交换,但位于当前命名空间中的标记(如a和b)是可以交换的。而对象本身是仍

2016-02-19 00:21:06 35531

转载 【转】python的内建函数:filter,map,reduce,lambda,sorted等

Python内置了一些非常有趣但非常有用的函数,充分体现了Python的语言魅力!filter(function, sequence):对sequence中的item依次执行function(item),将执行结果为True的item组成一个List/String/Tuple(取决于sequence的类型)返回:>>> def f(x): return x % 2 != 0 and

2015-12-01 20:26:06 515

原创 有关Post-hoc

ANOVA的原假设:μ1=μ2=μ3=……=μn,备择假设:μ1、μ2、μ3、……、μn不全相等 当只有两个level时,原假设μ1=μ2,备择假设μ1≠μ2,如果F统计量显著,那么拒绝原假设,认为μ1不等于μ2 当>两个level时(这里假设是三个level),如果F统计量显著,那么拒绝原假设,我们只能的出μ1,μ2,μ3不全部相等的结论,无法知道μ1,μ2,μ3究竟哪几组不相等

2015-11-28 12:02:53 3721 2

原创 python的文件句柄一次只能用一次

最近用python时遇到了一个问题, 我用infile=open(sys.argv[1],'r')打开一个句柄,第一次时prepare_chr函数调用了infile,紧接着是process函数调用了它,但是输出的结果是,prepare_chr能读取infile的信息,而process函数里面无法读取infile的内容!!!后来才发现,用open打开一个文件句柄,只能被调用一次,

2015-11-25 10:56:48 2983

转载 python文件与目录操作

一、python中对文件的操作——os模块详解: 右边为Linux所对应的命令1. 内容:得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()                                [pwd]返回指定目录下的所有文件和目录名:os.listdir()                                    

2015-11-19 11:32:03 494

原创 [python项目一]查找输出fasta序列的gap的起始终止等信息

一、需要实现的程序内容及输出:对于输入的fasta序列,编写程序查找里面N的起始,终止位置等信息,如下面的染色体test.fa序列为例:>1 dna_sm:chromosome chromosome:UMD3.1:1:1:158337067:1 REFaaattagacactgaagagacttggaaagagaggaagtcaaataacaaagaagaggaaaccaaaagg

2015-10-08 10:56:17 2602

原创 用python进行项目实训的计划

以下是用python来完成一些项目的相关的计划,主要分三个阶段:第一阶段:将perl相关的程序翻译成python,主要是对现有的工作中的perl脚本能够熟练地改写成python,以达到熟练运用python的目的主要的项目内容有:                              1. 完成基本的用perl编写的,而且代码量在100以内的小程序,如统计GC含量、fasta

2015-10-06 22:46:57 4503

原创 如何在面试中面试官的提示下,积极地思考?

曾经看过一篇博文,讲述博主在面试阿里时,由面试官一步步引导,不停地思考,从而对同一个问题给出了多种解决方法,但是现在找不到了。

2015-10-05 23:24:34 461

原创 用python编写统计fasta格式的序列的长度脚本

如果用perl来编写统计fasta序列的长度脚本,很简单的几行代码就可以搞定,但是想了想,觉得用python写更时候处理大的文件,尤其是想用python实现多线程处理。因此,就有了用python来编写最初版的统计fasta序列长度的脚本的想法。 运行方法:nohup python stat_length.py input.fasta > input.len &运行结果:>Aquca_0

2015-09-30 22:22:24 9290 1

原创 用python统计scaffold的N50等信息

最近用python编写了统计scaffoldN50和contigN50等信息的脚本。运行结果截图如下:源代码如下:#!/usr/bin/env python#func: cal N50,N60,N70,N80,N90,finalimport os,sysimport operatorimport datetimeimport refrom optpars

2015-09-30 22:12:43 6349

转载 【转】python经典面试题目

Python是如何进行内存管理的? http://developer.51cto.com/art/201007/213585.htm (没看懂) 什么是lambda函数?它有什么好处? http://www.kuqin.com/diveinto_python_document/apihelper_lambda.html 解释一下python的 and-or 语法 h

2015-09-11 23:31:58 611

转载 【转】正则表达式 文本处理三剑客的总结

0 正则表达式的基础^               行首标识$                篇尾标识或行尾标识.                代表任意一个字符?               代表前趋字符的一次出现*               代表0个或多个前趋字符出现[1-9]          代表一个属于1-9的字符[^1-9]  

2015-08-18 15:07:56 457

原创 提取最长转录本的代码

1.最长转录本:就是gene的id相同,但是序列的长度不一样,应该挑选出序列最长作为后面的分析下面就是一个转录本的id文件,都是来自同一个gene,但是转录本的id和长度均不相同分析:发现除了第4列表示的基因id相同以外,其他的列均不相同。2.过滤最长转录本的编程思路:     考虑到绵羊的转录本的id的复杂性,主要按一下几个步骤来实现:step1: 读取转录本

2015-08-09 19:19:18 8588

原创 如何用awk过滤最后一行的?

最近需要对fasta文件的id进行处理,输入的ID格式如下:而我要处理成:也就是过滤文件的最后一列,目前过滤文件的最后一列的方法有如下:(1) awk '{print $1"\t"$2"\t"$3"\t"$4"\t"$5}' 解析:因为该文件有六列,过滤最后一列也就是只打印前五列,但是存在的问题是:awk打印出来的第一列和第二列之间的空格数对应不起来(2

2015-08-09 17:51:39 8972 1

原创 如何统计id很复杂的fasta文件的长度?

对于一般的fasta文件的格式是:>chr1AAGCCATCCGG但是最近两天遇到id很复杂的fasta,对于这样的fa文件用现有的脚本却统计错误原本人的hg38染色体有23条染色体,但是统计出来却只有一条染色体的长度:因此,需要重新修改length.pl

2015-08-04 15:19:13 1870

转载 [转]C语言中通过分隔符来截取字符串

从一个文本文件中按行读取数据,一行数据中每一列都可能含有空格,所以你要把空格给截取出来。列之间是通过TAB键分割的。我在一开始使用了C的库函数strtok这个函数。先介绍一下strtok这个函数原型:char *strtok(char *src, char *flag)参数一是你要截取的字符串,参数2是字符串中的分隔符。看一下linux的man手册是如何结束

2015-03-22 23:05:06 716

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除