python
文章平均质量分 68
青灯照颦微
这个作者很懒,什么都没留下…
展开
-
【python】numpy常用属性
对应mlst列表中的数据落在bined对应数值(区域)的索引。:生成随机数前,指定随机种子为int,用于固定随机输出值。:按指定比例获取数据列表的分位数值。指定是否返回:原数组元素对应的去重后的索引。注意:固定种子后,多次随机生成的值相同。:生成int个[0,1)之间的随机数。生成全为0的数组,可以指定多个维度。: 获取指定区间和步长的列表。注意:多次随机输出的数据不同。:打乱原来的list顺序。获取相同形状的数组。原创 2023-10-25 10:53:49 · 841 阅读 · 0 评论 -
【python】可视化-绘制带有边权重的无向图
*示例数据1:**3个特征之间的关系数据 (**示例数据2:**4个特征之间的关系数据 (输入数据表(矩阵),绘制无向图。原创 2023-10-08 18:15:58 · 1299 阅读 · 0 评论 -
【python】使用Nuitka打包python项目-demo示例
使用Nuitka打包python项目。本文的demo示例的代码/数据可从笔者的GitCode获取:HelloWorld。原创 2023-09-20 15:09:32 · 1555 阅读 · 1 评论 -
【python】jupyter notebook导出pdf和pdf不显示中文问题
使用jupyter notebook导出pdf时,出现了一些问题:1)会报错,缺少安装包;2)没有报错并且生成了pdf,但是只显示英文,不显示中文。下面是给出了一些网搜后适用自己的解决办法。原创 2023-08-23 11:35:57 · 12850 阅读 · 10 评论 -
【python】从Ensembl上,根据Array HumanMethylation450甲基化探针cg编号(比如cg13788592)获取位置
一篇专利1中提到多种癌种及对应的特异性CpG位点,想获取对应cg位点具体的位置或序列。专利中的一组CpG markers如下:需求就是:将这些cg编号作为文件输入,获取对应的序列和位置信息。原创 2023-07-14 17:42:14 · 1577 阅读 · 0 评论 -
【python】dataframe重复索引修改
比如有如下数据表,其中index有重复,且重复的次数不等。需求是:将相同的index进行批量修改,修改为不同的index。比如,给每个相同的idnex加一个后缀(1,2,3,…):其中,index_column为修改后的索引,index则对应按数值0,1,2,…的索引。(当然也可以用drop去除)原创 2023-07-12 10:44:58 · 1434 阅读 · 0 评论 -
【python】数据预处理:分位数归一化 Quantile Normalization + INSCODE AI创作助手测试
这里主要了解一下分位数归一化(。如无特殊说明时,本文中的QN作为分位数归一化的缩写。Quantile Normalization 直接翻译是 分位数归一化,但也有翻译为分位数标准化。笔者理解是按直译叫分位数归一化,但是按数据的处理方式,应该叫分位数标准化,按英文的话就一种:Quantile Normalization。之所以有标准化和归一化两种说法,是因为它们是两种不同的处理方式。本文暂统一名称叫分位数归一化(QN)。原创 2023-05-31 16:57:43 · 6299 阅读 · 0 评论 -
【python】根据数据自定义绘制ROC和最优阈值
f1-score: 2TP/(2TP+FP+FN),混合度量,对不平衡类别有效。【2倍的真阳性/(2倍的真阳+真实为阳预测为阴[假阴]+预测为阳真实为阴[假阳])】绘图示例:图中的红点为最优点,对应的由下角是阈值、横坐标和纵坐标的值。precision: 精准率,precision=TP/(TP+FP), 预测的阳性中,是真的阳性的比例;TPR(True Positive Rate) 真阳率: TPR = TP/(TP+FN),所有。样本中,预测为阳的比例。(灵敏度+特异度-1)进行评价得到的最优。原创 2023-03-02 11:11:52 · 1810 阅读 · 0 评论 -
【math】利用Cardano方法对一元三次方程求解及python实现
python 使用Cardano方法求解一元三次方程。多种求解方法,其中Cardano可以根据对应解写出方程的解。可以使用python包,但是发现一个问题,需要详细看下包中bug如何解决?原创 2022-11-24 12:13:12 · 1451 阅读 · 0 评论 -
【python】根据自定义曲线函数进行拟合
python 根据自定义函数曲线进行拟合原创 2022-11-23 14:20:22 · 3161 阅读 · 0 评论 -
【bioinfo】根据sam文件中的MD标签判断reads比对情况
MD标签是值:比对上的相对位置信息和错误信息。根据MD标签判断read的比对情况。原创 2022-10-20 15:28:34 · 647 阅读 · 0 评论 -
【python】两个bed文件取交集
这里写的python脚本纯属造轮子,而且运行速度很慢,还需要改进。分别是:bed交集,bed1独有的位点,bed2独有的位点。执行后,outdir目录下有3个文件。原创 2022-10-19 09:18:10 · 1206 阅读 · 2 评论 -
【bioinfo】fasta/fastq/sam格式互相转化
使用awk转化:fq2fa:awk '{if((NR+3)%4==0)printf ">"$1;if((NR+2)%4==0)print "\n"$1}' ${fq} > ${fa}samtools fastqsamtools fastq -n ${sam} > ${fq}-n: 输出不标记"/1"或 “/2”, Read1、Read2的标记原创 2022-10-14 14:42:57 · 6922 阅读 · 0 评论 -
【python】使用pandas dataframe.plot直接画箱图
dataframe.plot 修改参数设置 对特定图,有特定的模块与对应的参数,比如箱图参数y轴设置(x轴同理)原创 2022-09-09 11:34:56 · 5511 阅读 · 0 评论 -
【python】把区间或逗号分割字符转换为list
把区间或逗号分割字符转换为list。原创 2022-08-05 17:39:51 · 1995 阅读 · 0 评论 -
【python】使用pysam读取sam/vcf/fasta文件时的常用属性
判定该记录序列信息是read1或read2,是否是反向比对?判定该记录序列信息是否未比对上?配对序列是否反向比对?配对序列是否未比对上?读取sam文件时,熟悉一些常用的属性。如何将读取的信息转换成字符?............原创 2022-08-04 18:41:51 · 7921 阅读 · 3 评论 -
【python】带格式合并两个excel中的所有或部分sheet
带格式合并两个excel表格中的所有或部分sheet。原创 2022-07-18 16:25:02 · 1263 阅读 · 0 评论 -
【python】将多个tsv文件合并到excel表中
将某个目录下多个特定文本文件,合并到excel表中。并要求将文件名作为sheet名,每个sheet中第一行第一个单元格填写对应文件的所在路径,单元格格式使用Times New Roman。原创 2022-07-17 20:15:00 · 1001 阅读 · 0 评论 -
【python/R】绘制箱图参考
使用R和Python绘图:箱图叠加散点图写在前面看一组数据的分布情况,可绘制箱图。如果想在箱图基础上看数据的具体分布情况,可考虑将数据以散点的形式绘制在箱图上。参考R绘图参考:https://www.r-graph-gallery.com/Python绘图参考:https://matplotlib.org/gallery/index.html...原创 2022-07-14 18:15:00 · 153 阅读 · 0 评论 -
【python】选择合适的机器学习模型
选择合适的机器学习模型原创 2022-06-21 18:58:20 · 1155 阅读 · 0 评论 -
python 合并列表中有相同元素的列表
python实现列表中相同元素合并原创 2022-06-01 12:36:55 · 3680 阅读 · 0 评论 -
python 把多层嵌套列表展成一层嵌套
需求是:一个多层嵌套的列表,每个嵌套列表有2个列表元素(注意这里实现的是两个元素),将多个嵌套展开成一层列表嵌套。目的是,保留最后的一层列表结构。示例输入和输出:输入:[[[[‘ABC’, ‘efg’], [‘T’, ‘C’]], [‘d’]], [‘c’]]输出:[[‘ABC’, ‘efg’], [‘T’, ‘C’], [‘d’], [‘c’]]注意: 这里输入的列表中有3层嵌套,希望输出的列表只有1层嵌套,且输入的列表每层嵌套中,只有两个列表元素。a = [[[['ABC', 'ef原创 2022-05-30 20:49:31 · 1755 阅读 · 0 评论 -
python画散点图 - 坐标轴显示顺序与输入不一致解决
问题描述:散点图绘制,输入的x轴的值与图中的x轴的值顺序不同,默认会将输入的x轴的值先排序,再将xy对应画图,但实际期望按y的值排序画图。解决:用xticks修改x坐标值,需要注意,画散点图输入的x值先自定义,再替换。代码:import matplotlib.pyplot as pltx_lst = ['10_abc', '9_ac', '12_ced', '12_cc', '20_de', '19_ab']y_lst = [100, 80, 70, 50, 30, 10]# 一开始绘图原创 2022-03-09 11:25:12 · 4979 阅读 · 0 评论 -
了解几种排序算法-归并、插入、桶、堆排序
文章目录归并排序(merge sort)插入排序(insertion sort)堆排序(heapSort)桶排序(BucketSort):代码参考归并排序(merge sort)1. eg: input '[3, 44, 38, 5, 47, 15, 36]' sorted: '[3, 5, 15, 36, 38, 44, 47]'2. 手推排序: (从小到大排) 3, 44, 38, 5, 47, 15, 36 step1: 两两比较 3,原创 2021-12-28 11:14:49 · 469 阅读 · 0 评论 -
python 使用pandas.DataFrame.merge合并dataframe结果为空问题解决
问题描述使用python2的pandas合并两个datafreme时,结果为空,但实际上有相同的数据,但是结果并没有合并(就是合并结果未空)。官网:pandas.merge使用代码测试1:两个数据表格,默认pandas读取数据格式pands.dtype有差异,合并时无数据。import pandasdf1 = pandas.read_csv("data1.txt", sep='\t')df2 = pandas.read_csv("data2.txt", sep='\t')pandas.m原创 2021-08-13 15:46:05 · 9477 阅读 · 3 评论 -
python dataframe 报错 invalid type comparison
python 报错 invalid type comparison 解决办法报错信息:TypeError: invalid type comparison代码如下:import pandas as pdtst_data = 'tst_data.txt'tst_df = pd.read_csv(tst_data, sep='\t')tst_dftst_df[tst_df['Head2'] == "False"]具体报错:纠正要筛选的列的值类型:字符串类型转换为Bool值:tst_d原创 2021-05-18 17:26:31 · 5023 阅读 · 1 评论 -
【python】合并list中连续的数值,比如: [1,2,3, 7,8,9] 合并成[‘1~3‘, ‘7~9‘]
写在前面分享一下自己写的代码,比较简单,以后可能会复用,就在这里做个记录❀。简单说下,这里要实现的是什么,为什么要实现它,怎么实现它?What:给定一个列表(数值元素),将其相邻的元素以某种形式合并显示(转化为以字符串为元素的列表),例如:输入:[1, 2, 5, 6, 7, 8, 10]输出:[‘1~2’, ‘5~8’, ‘10’]输出格式可自定义,这里就是示例说明如何“合并...原创 2020-04-30 14:05:53 · 3969 阅读 · 3 评论 -
Python中 str/list/dict/set/tuple 的增删改查
文章目录写在前面字符(str)列表(list)字典(dict)集合(set)元组(tuple)DataFrame写在前面这里汇总一些常用变量的基本操作,主要包括字符型(str)变量,列表(list), 字典(dict), 集合(set),元组(tuple),二维数据结构DataFrame。字符(str)str - 增直接使用+连接字符a = 'str'a += 'AAA' # a变...原创 2020-03-31 10:14:51 · 2315 阅读 · 1 评论 -
【python】将数组list等分成几组
写在前面问题描述:给定一个数组,将其等分成N组,最后一组元素不足也作为一组。例如:将数组test_list = [3, 4, 5, 6, 7, 22, 35, 46, 78, 100],等分成数组:alist = [[3, 4, 5], [6, 7, 22], [35, 46, 78], [100]]对于上述问题的反向操作,也就是,给定数组alist,将其合并合并成一个数组test_l...原创 2019-10-22 16:39:42 · 7165 阅读 · 6 评论 -
线性回归系数求解及Python实现
求解线性回归系数已知nnn个观测值集合{(xi,yi),i=1,2,...,n}\{(x_i, y_i), i=1,2,...,n\}{(xi,yi),i=1,2,...,n}, 求回归系数aaa,使得预测值y^i=xia\hat{y}_i={x_ia}y^i=xia与真实值yiy_iyi的偏差平方和最小,即找目标函数S=∑(yi−y^)2S=\sum(y_i - \hat{y})^...原创 2019-08-01 14:03:04 · 16301 阅读 · 0 评论 -
【python】pandas读取csv格式数据时header参数设置
写在前面使用pandas中read_csv读取csv数据时,对于有表头的数据,将header设置为空(None),会报错:pandas_libs\parsers.pyx in pandas._libs.parsers.raise_parser_error() ParserError: Error tokenizing data. C error: Expected 4 fields in lin......原创 2019-06-20 16:07:53 · 99319 阅读 · 2 评论 -
【linux/python】通配符与正则表达式比较
字符匹配通配符linux命令行pythonLinuxegrep正则表达式参考文档功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入......原创 2019-06-19 16:23:50 · 939 阅读 · 2 评论