- 博客(30)
- 资源 (8)
- 收藏
- 关注
原创 T-test处理cafe的结果
记录一下,主要是写了一个t检验的部分,在整个代码的后半部分,前面主要是为了处理cafe文件,生成csv格式的文件,方便pandas读取。
2023-06-23 00:11:03 114
原创 纯Python:在给定pvalue的情况下比较cafe结果文件中任意两个节点的基因数目
cafe运行结果文件中,在给定p值的情况下比较任意两个节点的所有基因家族内的基因数目差异。注意:请在代码内部176行指定节点,以的格式,184行指定pvalue值。输入文件head 20。
2023-06-18 17:36:29 156
原创 阿里云服务器scp掉线的问题
shh远程服务器长时间不操作就会掉线,而且我最近想从阿里云服务器上下载数据,scp经常下载到一半就被踢出了,随后阿里云半小时内会拒绝你的访问,我认为应该是ssh长时间不操作掉线的问题,或者是阿里云不支持外部服务器scp访问他,总之是有问题我的解决方案是从别人的阿里云scp到我的阿里云,期间运行自动打印时间程序PrintByTime.py(不确定哪个是必要的)#!/usr/bin/pythonimport timeflag = 0while(flag <= 720): print "t
2022-05-23 17:11:05 418 1
原创 写个函数,用来批量输出字符串上多次匹配的位置信息
def findplace(str,seq): import re place = [] end = 0 pattern = re.compile(seq) while(1): a = pattern.search(str,end) if a == None: return place break else: position = a.span() place.append(position) end = position[1]使用方式:posi
2021-03-23 14:29:48 97
原创 抓取网站中的温度数据(最高温和最低温)v1(urllib.request)
这里是爬取网站的温度信息,针对2020年及以前的用这个版本,如果不行就用下一版本(两个版本的主要原因是网站的格式发生了改变,需要针对性改变一下)网站http://lishi.tianqi.com/代码使用方式python Get_The_Tem.py脚本名字:Get_The_Tem.py脚本内容:# -*- coding: utf-8 -*-"""@author: CC""" import re,csvimport urllibimport timeimport urllib.
2021-02-03 17:06:39 281 3
原创 纯Python read_counts 转FPKM v2
重新写了一个由reads_counts转FPKM矩阵的脚本,之前的那一般只适用于18个样本的,这里更新了一下,没有样本限制了。还是分为3步:grep "exon" genome.gtf > genome_exon.gtfpython count_genelen_from_gft.py genome_exon.gtf gene.lenpython Caculate_FPKM.py mapped_gene_number.txt gene.len raw_counts.matrix FPKM.mat
2020-12-29 23:57:37 2964 14
原创 把文件处理成一行,且每个字符之间加入空格
import re,sysfile = sys.argv[1]f1 = open(file,"r")for i in f1: i = i.strip() print (" ".join(i),end="")f1.close()
2020-12-20 17:20:09 271
原创 linux for + sed
for i in {B,C,D,E,F};do cp MtSnpA.sh MtSnp${i}.sh sed -i 's/mtDNA/M24/g' MtSnp${i}.sh sed -i "s/A\.1/$i\.1/g" MtSnp${i}.sh sed -i "s/A\.2/$i\.2/g" MtSnp${i}.shdone
2020-12-10 13:24:48 807
原创 处理fasta格式文件的函数,把序列按照名称和信息为字典的key,把序列内容作为value存入字典中
def displayfq(f): dickf = {} for i in f: if re.match(">",i): dickf[i]="" flag = i else: dickf[flag] = dickf[flag]+i return di
2020-12-06 21:34:52 490
原创 python 处理snp的vcf文件,统计snp在基因的intron、exon还是上游、下游还是不在基因及基因附近
1、c处理vcf文件,初步统计snp位置位置信息有5种down_stream是gene下游2k以内,up_stream 是gene上游2k以内,gene_exon是snp在外显子内,gene_intron是gene在内含子内,uninfluncial是gene不在上诉所有区域SnpType.py内容:#这个脚本是用来看snp哪些是在基因中(分为exon和intron),哪些是在基因的上游、下游#最终输出结果为:scaffold position 位置 geneid#输入文件1:snpeff结
2020-11-30 17:04:15 4882 8
原创 read_counts转FPKM(基于gtf和read_counts文件)(exon)
首先我们要把gtf文件中的exon抓取出来grep "exon" genome.gtf > genome_exon.gtf然后提取genome_exon.gtf文件中的gene的exon的长度和得到我们想要的gene的长度python count_genelen_from_gft.py genome_exon.gtf gene.len这其中count_genelen_from_gft.py的代码如下:import sys,refile1 = sys.argv[1]file2 = sy
2020-11-26 21:50:54 4608 5
原创 awk + if
awk '{if ($5 == 60) print $1}' NCmt_A_F12.sam > NCmt_A_F12_cl.sam
2020-11-11 14:06:35 195
原创 看sam文件中有多少中type类型,并按照顺序输出
import sysfile1 = sys.argv[1]filein = open (file1,'r')a = []sdick=set()for i in filein: a = i.split() sdick.add(a[1])#ldisk = list(sdick)#k = set(sorted(ldisk))j = []for i in sdick: try: i = int(i)
2020-11-11 13:38:50 192
原创 列表文件求不同组合下的交集
就是画Veen图的前期步骤吧,求文件相应的交集。我要处理的文件是这些然后我先把要处理的文件名提取到了2.txt文件下,2.txt内容如下raw_counts.matrix.A_vs_B.edgeR.DE_results.P0.01_C1.B-UP.subsetraw_counts.matrix.B_vs_C.edgeR.DE_results.P0.01_C1.C-UP.subsetraw_counts.matrix.C_vs_D.edgeR.DE_results.P0.01_C1.D-UP.su
2020-10-27 01:10:38 126
原创 pip更新至最新版报错问题pip安装模块超时问题都可以用这个解决
pip更新的时候使用提示的命令一直报错,下载到一半就报错了,更改更新命令始终无法解决!!!最后发现是镜像源的问题,指定国内源后问题得到解决python -m pip install --upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simpleLooking in indexes: https://pypi.tuna.tsinghua.edu.cn/simpleRequirement already up-to-date: pip in c:
2020-09-05 02:08:46 636
原创 对质数的判断并统计一定取值空间内质数的个数
两个函数 def juges(s) 判断正整数 s 是不是质数,def tyPrNum (a) 统计 [0,a] 区间内质数的个数,并打印区间内所有质数。import cmaths=eval(input("请输入一个整数:"))def juges(s): flag=1 if s % 6 !=1 and s % 6 != 5: flag = 0 i = 5 while(i <= round(cmath.sqrt(s).real)): if s % i == 0 or s % (i
2020-08-17 08:25:56 176
原创 获取斐波那契数列的第n个数
首先,定义一个函数,输入为正整数n,返回第n个斐波那契数。然后调用函数就可以了。def feibona(n): count = [] a = 0 b = 1 count.append(a) count.append(b) while(1): a,b = b,a+b count.append(b) try: count[n-1] return count[n-1] except: continuen = eval(input("请输入一个整数:"))a
2020-08-17 08:20:00 900
原创 【python羊车门问题】完全模拟
python羊车门问题完全模拟代码思路进行一定的游戏次数,对坚持第一次选择胜利(选到汽车)的次数count1进行统计。进行一定的游戏次数,对更改选择获得胜利的次数count2进行统计。最终用count1/times以及count2/times获得两种选择的获胜概率。import randomtimes = eval(input("输入计划进行游戏的次数:")) #输入玩游戏的次数count1 = 0 #不换选择胜利的次数count2 = 0 #换先择获得的次数''' 如果玩times次游戏
2020-08-16 18:30:53 744
原创 自己写的一些文件处理的函数,记录一下
#!usr/bin/python# -*- coding: utf-8 -*-#coding=utf-8import sys,os,re#t=sys.argv[1]#f=open(t,"r")#按行序选取特定行#输入参数 文件标识: f#输入参数 起始行数: start_line#输入参数 终止行数: dead_line=0#输入参数 截取周期: zhouqi...
2020-03-23 16:42:06 135
原创 获取染色体长度(bp)
有时候我们需要知道fasta文件的具体某条染色体的长度#!usr/bin/python# -*- coding: utf-8 -*-#coding=utf-8import sys,ret=sys.argv[1]#fasta文件num=sys.argv[2]#染色体ID 比如第一条染色体 就输入 1num=int(num)nextnum=num+1sca_line=0f=open...
2020-03-23 16:36:11 2965 2
原创 抓取网站上的历史温度数据
温度数据网址为:添加链接描述python版本为3.7.7重点在于不用再安装模块# -*- coding: utf-8 -*-"""@author: CC""" import reimport urllibimport timeimport urllib.request#from urllib import request"""设置需要爬取的地区,使用该地区的拼音设置需...
2020-03-22 12:53:35 260
原创 按照指定大小分割文件
我们在处理文件的时候有的文件过大,不好处理,或者软件输入有限定,此时需要分割文件,这里提供按照指定大小分割文件的方法,本方法参照某博主的代码,但是他的代码我在win10用Python3.8.1跑有死循环的问题,会不断生成文件。这里更新后代码如下:import sys,os,redef split_file_by_KB(t,size): fp=open(t,'rb') i=0 n=0 d...
2020-02-29 11:42:50 388
原创 DS18B20读取温度并显示在数码管上
下面是我的函数分3个文件:头文件,DS18B20系列子函数文件,主函数部分(既数据处理和显示部分)头文件#ifndef __TEMP_H_#define __TEMP_H_#include<reg52.h>#ifndef uchar#define uchar unsigned char#endif#ifndef uint #define uint unsign...
2018-11-26 16:56:07 8481 2
原创 华中科技大学电路理论课程PPT分析
华中科技大学电路理论课程PPT分享链接:https://pan.baidu.com/s/1svn7QzBVTIpWnSjwUHx8oA提取码:jnhd
2018-11-22 21:35:41 1146
STC15F100系列单片机简介以及主要寄存器介绍
2018-12-01
Linux设备驱动开发详解—宋宝华
2018-11-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人