![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
离子回旋
言念君子,温其如玉
展开
-
T-test处理cafe的结果
记录一下,主要是写了一个t检验的部分,在整个代码的后半部分,前面主要是为了处理cafe文件,生成csv格式的文件,方便pandas读取。原创 2023-06-23 00:11:03 · 83 阅读 · 0 评论 -
纯Python:在给定pvalue的情况下比较cafe结果文件中任意两个节点的基因数目
cafe运行结果文件中,在给定p值的情况下比较任意两个节点的所有基因家族内的基因数目差异。注意:请在代码内部176行指定节点,以的格式,184行指定pvalue值。输入文件head 20。原创 2023-06-18 17:36:29 · 125 阅读 · 0 评论 -
纯python统计基于orthofinder得到的系统发育树的关注点位置的树型结构
系统发育树的树型结构统计傻瓜教程原创 2023-05-17 18:49:46 · 712 阅读 · 0 评论 -
处理连续温度数据,并绘制图片(含命令行接口定义方法)python
po上一个以前写的但没有po上来的脚本,主要是怕以后找不到了QAQ。原创 2023-03-05 23:52:09 · 87 阅读 · 0 评论 -
处理excel表格的实验数据
python处理excel表格,涉及到datetime模块时间加减的使用原创 2023-02-20 17:14:16 · 138 阅读 · 0 评论 -
gz文件(二进制读写)匹配内容
以二进制方式读写的文件的内容匹配含gz文件读写原创 2022-12-19 10:13:46 · 152 阅读 · 0 评论 -
阿里云服务器scp掉线的问题
shh远程服务器长时间不操作就会掉线,而且我最近想从阿里云服务器上下载数据,scp经常下载到一半就被踢出了,随后阿里云半小时内会拒绝你的访问,我认为应该是ssh长时间不操作掉线的问题,或者是阿里云不支持外部服务器scp访问他,总之是有问题我的解决方案是从别人的阿里云scp到我的阿里云,期间运行自动打印时间程序PrintByTime.py(不确定哪个是必要的)#!/usr/bin/pythonimport timeflag = 0while(flag <= 720): print "t原创 2022-05-23 17:11:05 · 346 阅读 · 1 评论 -
提取fasta格式文件中的指定多个序列
提取fasta文件中的指定序列,单个多个都行原创 2022-04-24 18:16:58 · 705 阅读 · 0 评论 -
写个函数,用来批量输出字符串上多次匹配的位置信息
def findplace(str,seq): import re place = [] end = 0 pattern = re.compile(seq) while(1): a = pattern.search(str,end) if a == None: return place break else: position = a.span() place.append(position) end = position[1]使用方式:posi原创 2021-03-23 14:29:48 · 79 阅读 · 0 评论 -
抓取网站中的温度数据(最高温和最低温)v1(urllib.request)
这里是爬取网站的温度信息,针对2020年及以前的用这个版本,如果不行就用下一版本(两个版本的主要原因是网站的格式发生了改变,需要针对性改变一下)网站http://lishi.tianqi.com/代码使用方式python Get_The_Tem.py脚本名字:Get_The_Tem.py脚本内容:# -*- coding: utf-8 -*-"""@author: CC""" import re,csvimport urllibimport timeimport urllib.原创 2021-02-03 17:06:39 · 251 阅读 · 3 评论 -
纯Python read_counts 转FPKM v2
重新写了一个由reads_counts转FPKM矩阵的脚本,之前的那一般只适用于18个样本的,这里更新了一下,没有样本限制了。还是分为3步:grep "exon" genome.gtf > genome_exon.gtfpython count_genelen_from_gft.py genome_exon.gtf gene.lenpython Caculate_FPKM.py mapped_gene_number.txt gene.len raw_counts.matrix FPKM.mat原创 2020-12-29 23:57:37 · 2781 阅读 · 14 评论 -
把文件处理成一行,且每个字符之间加入空格
import re,sysfile = sys.argv[1]f1 = open(file,"r")for i in f1: i = i.strip() print (" ".join(i),end="")f1.close()原创 2020-12-20 17:20:09 · 246 阅读 · 0 评论 -
处理fasta格式文件的函数,把序列按照名称和信息为字典的key,把序列内容作为value存入字典中
def displayfq(f): dickf = {} for i in f: if re.match(">",i): dickf[i]="" flag = i else: dickf[flag] = dickf[flag]+i return di原创 2020-12-06 21:34:52 · 470 阅读 · 0 评论 -
看sam文件中有多少中type类型,并按照顺序输出
import sysfile1 = sys.argv[1]filein = open (file1,'r')a = []sdick=set()for i in filein: a = i.split() sdick.add(a[1])#ldisk = list(sdick)#k = set(sorted(ldisk))j = []for i in sdick: try: i = int(i)原创 2020-11-11 13:38:50 · 142 阅读 · 0 评论 -
列表文件求不同组合下的交集
就是画Veen图的前期步骤吧,求文件相应的交集。我要处理的文件是这些然后我先把要处理的文件名提取到了2.txt文件下,2.txt内容如下raw_counts.matrix.A_vs_B.edgeR.DE_results.P0.01_C1.B-UP.subsetraw_counts.matrix.B_vs_C.edgeR.DE_results.P0.01_C1.C-UP.subsetraw_counts.matrix.C_vs_D.edgeR.DE_results.P0.01_C1.D-UP.su原创 2020-10-27 01:10:38 · 108 阅读 · 0 评论 -
pip更新至最新版报错问题pip安装模块超时问题都可以用这个解决
pip更新的时候使用提示的命令一直报错,下载到一半就报错了,更改更新命令始终无法解决!!!最后发现是镜像源的问题,指定国内源后问题得到解决python -m pip install --upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simpleLooking in indexes: https://pypi.tuna.tsinghua.edu.cn/simpleRequirement already up-to-date: pip in c:原创 2020-09-05 02:08:46 · 580 阅读 · 0 评论 -
对质数的判断并统计一定取值空间内质数的个数
两个函数 def juges(s) 判断正整数 s 是不是质数,def tyPrNum (a) 统计 [0,a] 区间内质数的个数,并打印区间内所有质数。import cmaths=eval(input("请输入一个整数:"))def juges(s): flag=1 if s % 6 !=1 and s % 6 != 5: flag = 0 i = 5 while(i <= round(cmath.sqrt(s).real)): if s % i == 0 or s % (i原创 2020-08-17 08:25:56 · 159 阅读 · 0 评论 -
获取斐波那契数列的第n个数
首先,定义一个函数,输入为正整数n,返回第n个斐波那契数。然后调用函数就可以了。def feibona(n): count = [] a = 0 b = 1 count.append(a) count.append(b) while(1): a,b = b,a+b count.append(b) try: count[n-1] return count[n-1] except: continuen = eval(input("请输入一个整数:"))a原创 2020-08-17 08:20:00 · 872 阅读 · 0 评论 -
【python羊车门问题】完全模拟
python羊车门问题完全模拟代码思路进行一定的游戏次数,对坚持第一次选择胜利(选到汽车)的次数count1进行统计。进行一定的游戏次数,对更改选择获得胜利的次数count2进行统计。最终用count1/times以及count2/times获得两种选择的获胜概率。import randomtimes = eval(input("输入计划进行游戏的次数:")) #输入玩游戏的次数count1 = 0 #不换选择胜利的次数count2 = 0 #换先择获得的次数''' 如果玩times次游戏原创 2020-08-16 18:30:53 · 672 阅读 · 0 评论 -
自己写的一些文件处理的函数,记录一下
#!usr/bin/python# -*- coding: utf-8 -*-#coding=utf-8import sys,os,re#t=sys.argv[1]#f=open(t,"r")#按行序选取特定行#输入参数 文件标识: f#输入参数 起始行数: start_line#输入参数 终止行数: dead_line=0#输入参数 截取周期: zhouqi...原创 2020-03-23 16:42:06 · 117 阅读 · 0 评论 -
获取染色体长度(bp)
有时候我们需要知道fasta文件的具体某条染色体的长度#!usr/bin/python# -*- coding: utf-8 -*-#coding=utf-8import sys,ret=sys.argv[1]#fasta文件num=sys.argv[2]#染色体ID 比如第一条染色体 就输入 1num=int(num)nextnum=num+1sca_line=0f=open...原创 2020-03-23 16:36:11 · 2847 阅读 · 2 评论 -
抓取网站上的历史温度数据
温度数据网址为:添加链接描述python版本为3.7.7重点在于不用再安装模块# -*- coding: utf-8 -*-"""@author: CC""" import reimport urllibimport timeimport urllib.request#from urllib import request"""设置需要爬取的地区,使用该地区的拼音设置需...原创 2020-03-22 12:53:35 · 238 阅读 · 0 评论 -
按照指定大小分割文件
我们在处理文件的时候有的文件过大,不好处理,或者软件输入有限定,此时需要分割文件,这里提供按照指定大小分割文件的方法,本方法参照某博主的代码,但是他的代码我在win10用Python3.8.1跑有死循环的问题,会不断生成文件。这里更新后代码如下:import sys,os,redef split_file_by_KB(t,size): fp=open(t,'rb') i=0 n=0 d...原创 2020-02-29 11:42:50 · 364 阅读 · 0 评论