Python
风灬陌
风过无痕,陌路红尘
展开
-
使用python简单实现三种常见的降维方法:PCA、t-SNE和Umap(降到二维进行可视化)
使用python简单实现三种常见的降维方法:PCA、t-SNE和Umap(降到二维进行可视化)原创 2022-06-19 22:08:09 · 9682 阅读 · 0 评论 -
使用python简单实现K核苷酸频率(KNF,k-nucleotide frequencies)或K-mer频率
K核苷酸频率(KNF,k-nucleotide frequencies)或K-mer频率KNF描述了序列中存在k个核苷酸的所有可能的多核苷酸的频率。原创 2022-05-17 00:20:27 · 1089 阅读 · 3 评论 -
使用Python画ROC曲线和PRC曲线
受试者工作特征曲线(Receiver operating characteristic curve,ROC)精确召回曲线(Precision recall curve,PRC)原创 2022-04-16 09:34:51 · 4361 阅读 · 0 评论 -
常见机器学习模型的便捷使用(Python)
常见的机器学习模型有:逻辑回归(LR)、决策树(DT)、随机梯度下降(SGD)、支持向量机(SVM)、随机森林(RF)、梯度提升决策树(GBDT)、极限梯度提升(XGBoost)和LightGBM。本文介绍了以上八种机器学习模型的便捷使用方法,实现了多个数据可对应多种模型。原创 2022-04-15 15:40:58 · 1939 阅读 · 0 评论 -
K核苷酸频率(KNF,k-nucleotide frequencies)或K-mer频率
K核苷酸频率(KNF,k-nucleotide frequencies)或K-mer频率KNF描述了序列中存在k个核苷酸的所有可能的多核苷酸的频率。如果k=2,则计算的为双核苷酸频率(即AA、AT、AG、AC、……TT),共42=16种;如果k=3,则计算的为双核苷酸频率(即AAA、AAT、AAG、AAC、……TTT),共43=64种;以此类推。K-mer频率亦如此。方法一:#提取核苷酸类型(排列组合)from itertools import productdef nucleotide_typ原创 2021-06-10 20:53:19 · 3136 阅读 · 3 评论 -
K-mer特征提取one-hot编码
K-mer特征提取one-hot编码定义K-mer函数,把序列转换成密码子形式def Kmers_funct(seq): X = [None]*len(seq) #若数据只有一个序列,可不用此定义 for i in range(len(seq)): #若数据只有一个序列,可不用此循环 a = seq[i] t=0 l=[] for index in range(len(a)): t=a[in原创 2020-12-18 10:13:34 · 1507 阅读 · 0 评论