python
awk_bioinfo
向前进。
展开
-
snp标记计算PIC,香农信息指数等值
snp标记计算PIC,香农信息指数等值。原创 2024-06-12 16:07:29 · 478 阅读 · 0 评论 -
利用python生成16进制颜色配色
python生成配色原创 2024-03-06 17:28:27 · 593 阅读 · 0 评论 -
xopen 一个高效压缩和解压缩python库碾压gzip
xopen高效压缩解压缩python库,碾压gzip。原创 2024-01-09 15:28:15 · 503 阅读 · 0 评论 -
利用codon神器10倍提升我的python代码效率
可以看到运行时间为13.530s,相较原生python脚本运行时间2m37.856s,效率提高了10倍以上。我用的centos7.9,如果报gcc编译器版本低,某些参数不支持,可通过执行。第一步:利用codon编译器将我的python脚本编译为可执行文件。通过以上操作即可切换GCC至9.3.1版本。第二步:直接执行该命令。原创 2023-03-23 15:29:37 · 1209 阅读 · 2 评论 -
Python输出炫彩颜色字体
python输出炫彩字体原创 2023-01-02 10:21:01 · 1407 阅读 · 2 评论 -
python 输出所有大小写字母
print [chr(i) for i in range(97,123)]#所有小写字母。print [chr(i) for i in range(65,91)]#所有大写字母。print [chr(i) for i in range(48,58)]#所有数字。print string.letters #包含所有字母(大写或小写)的字符串。print string.uppercase #包含所有大写字母的字符串。print string.lowercase #包含所有小写字母的字符串。转载 2022-09-23 17:34:55 · 3386 阅读 · 1 评论 -
python爬虫ssl.SSLCertVerificationError解决办法
python 爬虫证书验证失败原创 2022-08-15 08:29:29 · 6552 阅读 · 1 评论 -
pillow Image.alpha_composite Image.blend Image.paste 图像合并方法汇总
pillow 图像合并转载 2022-07-14 11:55:55 · 619 阅读 · 0 评论 -
sublime text 4 license
sublime转载 2022-06-02 22:17:12 · 8024 阅读 · 14 评论 -
python常用PDF库总结
使用Python操作PDF:常用PDF库总结PDF(Portable Document Format)是一种便携文档格式,便于跨操作系统传播文档。PDF文档遵循标准格式,因此存在很多可以操作PDF文档的工具,Python自然也不例外。本文从功能、开源协议及社区活跃度三方面对比7个常用的Python第三方库,以便根据具体需求选择合适的库。常见PDF库PyPDF2 (已不再维护,继任者PyPDF4)由于PyPDF2似乎更知名,故本文以其作为条目列出。PyPDF、PyPDF2及PyPDF4的渊源[1]。转载 2022-05-19 17:18:35 · 3481 阅读 · 0 评论 -
python手写进度条
import math,timetask_num = 1000 # (指定总任务数)for i in range(1,task_num+1): time.sleep(0.1) print("\r%s %.2f %%" %('='*math.floor(i/task_num*100),i/task_num*100),end='')原创 2022-03-26 11:55:05 · 4147 阅读 · 0 评论 -
pymysql安全回滚操作
db = pymysql.connect(user='root', password='mysql', database='test', host='127.0.0.1', port=3306, charset='utf8mb4') name_list = ["re", "gh", "ds", "D"] # 存储name的值age_list = ["10", "20", "30", "40"] # 存储age的值id_list = ["1", "2", "3", "4"] # 存储id的值v转载 2022-02-25 14:53:09 · 1015 阅读 · 0 评论 -
python 传参 *args **kwargs详解
*args 和 **kwargs 可以将不定数量的参数传递给函数args 和 **kwargs,前者适用于传入非键值对的可变数量的参数列表,后者适用于传入不定长度的键值对(字典), 作为参数传递给函数。**kwargs 就是在args 的基础上,添加了变量名以及转变了格式(哈希字典)1.将*args 和 **kwargs应用在调用函数时#定义一个函数:def test(farg,arg1,arg2,arg3): print("farg参数为:",farg) print("arg1转载 2022-02-23 16:39:53 · 4148 阅读 · 0 评论 -
python3利用pymysql将sql取出数据转为字典列表类型
方法一cursor = conn.cursor(pymysql.cursors.DictCursor) # 让mysql取出值从元组变成字典方法二def sqlToJson(cursor,sql,table_name): cursor.execute(sql) key = cursor.execute("select COLUMN_NAME from information_schema.columns where table_name=%s",(table_name,)).fetc原创 2022-02-22 17:42:42 · 2888 阅读 · 0 评论 -
将pip源更换到国内镜像
将pip源更换到国内镜像用pip管理工具安装库文件时,默认使用国外的源文件,因此在国内的下载速度会比较慢,可能只有70KB/s。幸好,国内的一些顶级科研机构已经给我们准备好了各种镜像,下载速度可达34MB/s。其中,比较常用的国内镜像包括:(1)阿里云 http://mirrors.aliyun.com/pypi/simple/(2)豆瓣http://pypi.douban.com/simple/(3)清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/原创 2022-02-11 13:40:26 · 417 阅读 · 0 评论 -
pandas读入数据修改列名
1.读入数据:import pandas as pddf1 = pd.read_csv(‘target.csv’,encoding=‘utf-8’,header=1)df1 = pd.read_csv(‘target.csv’,encoding=‘utf-8’,header=-1) # 用于读取无表头CSV文件2.修改列名方法一:暴力修改列名,即重新命名列名df1.columns=[‘a’,‘B’,‘c’]方法二,利用rename修改(注需加入inplace=True才会在原数据中生效)d原创 2021-09-16 15:33:58 · 3912 阅读 · 2 评论 -
混淆矩阵优质可视化图
画图代码如下:#此脚本用于绘制混淆矩阵图from sklearn import metricsimport matplotlib.pyplot as pltfrom sklearn.metrics import confusion_matriximport itertoolsdef plot_confusion_matrix(cm, target_names, plot_names,原创 2021-01-28 20:06:13 · 1204 阅读 · 0 评论 -
pandas用法详解
一、生成数据表1、首先导入pandas库,一般都会用到numpy库,所以我们先导入备用:import numpy as npimport pandas as pd2、导入CSV或者xlsx文件:df = pd.DataFrame(pd.read_csv(‘name.csv’,header=1))df = pd.DataFrame(pd.read_excel(‘name.xlsx’))3、用pandas创建数据表:df = pd.DataFrame({“id”:[1001,1002,1003,转载 2020-09-17 09:55:57 · 6827 阅读 · 0 评论 -
python中json文件处理
python中json文件处理涉及的四个函数json.dumps()和json.loads()、json.dump()和json.load()的区分一、概念理解1、json.dumps()和json.loads()是json格式处理函数(可以这么理解,json是字符串) (1)json.dumps()函数是将一个Python数据类型列表进行json格式的编码(可以这么理解,json.dumps()函数是将字典转化为字符串) (2)json.loads()函数是将json格式数据转换为字典(可以这原创 2020-08-10 22:04:43 · 138 阅读 · 0 评论 -
python3中multiprocessing Pool的map和apply_async使用异同
记录python multiprocessing Pool的map和apply_async方法在利用python多进程时,进程上运行的方法接收多个参数和多个结果时不一样Pool.map()多参数任务在给map方法传入带多个参数的方法不能达到预期的效果,像下面这样def job(x ,y):return x * yif name == “main”:pool = multiprocessing.Pool()res = pool.map(job, 2, 3)print res所以只能通过对有原创 2020-08-10 19:24:56 · 3355 阅读 · 0 评论 -
try,except,finally的用法
try,except,finally的用法try,except,finallytry…except形式:指定一个或多个异常处理器(异常子句).。当在try子句中没有异常发生时,,异常处理器将不被执行.当在try子句中有异常发生时,首先会执行except搜索异常处理器,它会按顺序搜索直到第一个匹配的处理器找到为止.。如果在except后面找到对应的异常声明,就会处理。如果没有找到,异常就会被临时保存起来,然后去执行finally语句,但如果finally中产生了新的异常或者执行了return或者b原创 2020-08-06 15:35:01 · 4510 阅读 · 0 评论 -
python爬虫beautifulsoup详细教程
BeautifulSoup4是爬虫必学的技能。BeautifulSoup最主要的功能是从网页抓取数据,Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。BeautifulSoup支持Python标准库中的HTML解析器,还支持一些第三方的解析器,如果我们不安装它,则 Python 会使用 Python默认的解析器,但lxml 解析器更加强大,速度更快,推荐使用lxml 解析器。BeautifulSoup4和 lxml 一样,Beautiful Soup 也是转载 2020-08-06 14:27:30 · 2757 阅读 · 0 评论 -
Python计算皮尔逊相关系数
Python三种方法计算皮尔逊相关系数(Pearson correlation coefficient)0 皮尔逊系数1 python计算方法1.1 根据公式手写1.2 numpy的函数1.3 scipy.stats中的函数0 皮尔逊系数 在统计学中,皮尔逊相关系数( Pearson correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,简称 PPMCC或PCCs)。用于衡量两个变原创 2020-06-19 17:07:55 · 9695 阅读 · 0 评论 -
计算基因组大小
faCount是UCSC中的一个工具,UCSC的安装可以看我的相关笔记。faCount可以统计得到基因组数据中的总碱基数和基因组装配中缺失碱基数(即被标位N的碱基)。有效基因组大小 = 总碱基数 - 被标为N的碱基数$ faCount hg.fa|sed -n ‘$p’|cut -f2#seq len A C G T N cpgchr1 28800734 8998530 4599939 4612033 8原创 2020-05-13 15:43:17 · 3001 阅读 · 0 评论 -
linux服务器配置jupyter notebook 远程访问
下载pip3 install -i https://pypi.douban.com/simple jupyter 或直接 pip3 install jupyter生成配置文件jupyter notebook --generate-config --allow-root配置文件生成在:~/.jupyter/jupyter_notebook_config.py设置密码jupyter no...原创 2020-03-23 11:29:03 · 296 阅读 · 0 评论 -
python调用threading模块程序命名踩坑记录
记一次python踩坑记录在导入python的threading多进程包的的时候总是出现报错,奇怪的是换了一个文件夹就可以正常运行了。尝试各种修改,发现所有的报错都一样。甚是奇怪。ImportError: cannot import name ‘Thread’ from ‘threading’ (~/script/threading.py)经过各种折腾,后来,终于搞明白了,原来是程序起的名字...原创 2020-03-22 22:43:50 · 737 阅读 · 0 评论 -
pip/pip3更换国内镜像源
pip/pip3更换国内镜像源Windows下更换镜像源打开用户目录 %Users/${username}/% , 如(C:/Users/用户名/), 在此目录下创建 pip 文件夹在 pip 目录下创建 pip.ini 文件, 内容如下[global]timeout = 6000index-url = https://pypi.tuna.tsinghua.edu.cn/simple...转载 2020-03-22 18:14:05 · 204 阅读 · 0 评论 -
在Linux系统安装python3.12以及pip
在Linux系统安装python3.12以及pip。原创 2020-03-22 17:43:14 · 7346 阅读 · 1 评论 -
python调用shell脚本的两种方法
python调用shell脚本的两种方法转载wendzU 发布于2018-04-07 14:33:28 阅读数 6096 收藏展开os.system()和os.popen()1.python调用Shell脚本,有两种方法:os.system()和os.popen(),前者返回值是脚本的退出状态码,后者的返回值是脚本执行过程中的输出内容。help(os.system)Help ...转载 2019-12-23 15:12:43 · 1081 阅读 · 0 评论 -
Python 中的“多维”字典 (multi-dimension dictionary)
字典 (dictionary)Python 中的dict可以实现迅速查找。那么有没有像数组有二维数组一样,有二维的字典呢?比如我需要对两个关键词进行查找的时候。2D dict 可以通过dict_2d = {‘a’: {‘a’: 1, ‘b’: 3}, ‘b’: {‘a’: 6}}1来建立,并通过dict_2d[‘a’][‘b’]1来访问。但是添加一个新的 “key-value”对却比...原创 2019-12-04 10:26:34 · 7476 阅读 · 1 评论 -
正则表达式 断言(?:)等的使用
转载 2019-12-03 11:42:00 · 205 阅读 · 0 评论 -
Python 正则re模块之findall()详解
Python 正则re模块之findall()详解先说一下findall()函数的两种表示形式import rekk = re.compile(r’\d+’)kk.findall(‘one1two2three3four4’)#[1,2,3,4]#注意此处findall()的用法,可传两个参数;kk = re.compile(r’\d+’)re.findall(kk,“one12...转载 2019-12-02 15:26:22 · 732 阅读 · 0 评论 -
Pandas中DataFrame数据合并、连接(concat、merge、join)
Pandas中DataFrame数据合并、连接(concat、merge、join)一、concat:沿着一条轴,将多个对象堆叠到一起 concat方法相当于数据库中的全连接(union all),它不仅可以指定连接的方式(outer join或inner join)还可以指定按照某个轴进行连接。与数据库不同的是,它不会去重,但是可以使用drop_duplicates方法达到去重的效果。...转载 2019-11-30 21:53:04 · 299 阅读 · 0 评论 -
生物信息Python-从入门到精通
生物信息Python-从入门到精通?Python开发的方向太多了,有机器学习,数据挖掘,网络开发,爬虫等等。其实在生信领域,Python还显现不出绝对的优势,生信的大部分软件流程都是用shell或Perl写的,而且已经足够好用了。我选Python是因为我想顺便学点数据挖掘和机器学习的东西,而且Python这些年越来越火,发展势头远超其他脚本语言,所以学它肯定是没错的。一、入门标准入门比较难定...转载 2019-11-09 09:40:17 · 1093 阅读 · 0 评论 -
python os 模块
os 模块Python 的 os 模块封装了常见的文件和目录操作,本文只列出部分常用的方法,更多的方法可以查看官方文档。下面是部分常见的用法:方法 说明os.mkdir 创建目录os.rmdir 删除目录os.rename 重命名os.remove 删除文件os.getcwd 获取当前工作路径os.walk 遍历目录os.path.join 连接目录与文件名os.pat...原创 2019-11-05 09:48:34 · 157 阅读 · 0 评论 -
sublime python环境(代码自动补全,调试python脚本等插件)
sublime python环境(代码自动补全,调试python脚本等插件)用过sublime和pycharm,两款各有优缺点,本人只是用来写一些脚本,不开发大型项目,选择轻量级的sublime编辑器,sublime需要根据开发语言,自己安装一些插件。sublime text 2下载地址:http://www.sublimetext.com/2sublime text 3下载地址:http:...原创 2019-12-03 11:42:41 · 406 阅读 · 0 评论 -
python读文件的三个方法read()、readline()、readlines()详解
python读文件的三个方法read()、readline()、readlines()详解1、读取文件的三个方法:read()、readline()、readlines()2、三个方法均可接受一个变量用以限制每次读取的数据量,通常不使用该变量。“”"“”"关于read()方法:1、读取整个文件,将文件内容放到一个字符串变量中2、如果文件大于可用内存,不可能使用这种处理“”"fil...转载 2019-11-04 16:53:43 · 800 阅读 · 0 评论 -
Python列表,元组,字典,集合详细操作
菜鸟学Python第五天数据类型常用操作及内置方法列表(list)基本使用用途用来存取多个同属性的值,用索引对应值,索引反映的是位置定义方式在[]内用逗号分隔开多个任意类型的值l = [1, 2.2, ‘str’, ‘list’, ‘…’] # l= list([1, 2.2, ‘str’, ‘list’, ‘…’])类型转换list可以将str、list、dict、tupl...原创 2019-11-02 21:11:20 · 512 阅读 · 0 评论 -
Python reduce未定义
Python reduce未定义问题:name ‘reduce’ is not defined解决:from functools import reduce原因:在python 3.0.0.0以后, reduce已经不在built-in function里了原创 2019-08-18 12:53:26 · 481 阅读 · 0 评论 -
生物信息学python必备包和库
**1.pysam :处理基因组序列工具,计算 比对 过滤 汇总**2.biopython:可处理多种生物信息学问题,计算分子生物学和生物信息学工具包**3.Dash_bio:开源 Python 库,用于生物信息学和药物开发应用。...原创 2019-08-08 18:42:56 · 5046 阅读 · 0 评论