python
文章平均质量分 95
竹篱茅舍1997
生物信息学、python、R、Linux、Perl学习交流
展开
-
Nature Machine Intelligence: 刘洋彧等利用神经常微分方程预测微生物代谢谱
表征微生物群落的代谢特征对于理解其生物学功能及其对宿主或环境的影响至关重要。直接测量这些特征的代谢组学实验是困难和昂贵的,然而,量化微生物群落的物种组成的测序方法已经发展得很好,而且成本相对较低。能够从微生物组成预测代谢组谱的计算方法可以节省代谢组谱实验所需的大量时间。然而,尽管已有了一些研究成果,我们仍然缺乏一种预测能力强、普遍适用性强、可解释性好的计算方法。翻译 2023-06-07 20:43:56 · 1260 阅读 · 0 评论 -
Nature Communications: 使用自然语言处理解密微生物基因功能
通讯作者为:以色列特拉维夫大学的David (Dudu) Burstein在测序数据量不断增加的时代,揭示未表征基因的功能是一项基本挑战。在这里,我们提出了一个使用自然语言处理(NLP)中采用的深度学习方法来应对这一挑战的概念。我们重新调整了NLP算法的用途,以基于其基因组背景下超过3.6亿个微生物基因的生物语料库为基础,对**“基因语义(gene semantics)”进行建模。翻译 2023-06-06 16:52:07 · 825 阅读 · 0 评论 -
TreeExplainer原文精读: 用于树的可解释人工智能SHAP Tree
如果不近似,TreeExplainer调用的函数是, 其定义为https://github.com/slundberg/shap/blob/master/shap/cext/_cext.cc#L113。下面的代码引用了Python.hPyObjectreturns atypenumand aflagsstruct 是 C 语言中用来定义结构体类型的关键字。static 关键字可以用来修改变量或函数的存储类别。翻译 2023-05-28 13:12:44 · 1535 阅读 · 0 评论 -
机器学习中解决不平衡分类的10种技术
作为一名数据科学家,二分类是最常见的分类模型之一。在解决这些问题时,一个常见的问题是类不平衡(class imbalance)。当一个类别的观察结果高于其他类别时,就会存在类别失衡。示例:检测欺诈性信用卡交易。翻译 2023-05-11 16:58:20 · 2196 阅读 · 0 评论 -
胶囊网络教程(Understanding Hinton’s Capsule Networks)
Hinton和他的团队提出了一种训练这种由胶囊组成的网络的方法,并在一个简单的数据集上成功地训练了它,实现了最先进的性能。这是非常令人鼓舞的。尽管如此,还是存在挑战。当前的实现比其他现代深度学习模型慢得多。时间将证明胶囊网络是否可以快速有效地进行训练。此外,我们需要看看它们在更困难的数据集和不同的领域是否能很好地工作。翻译 2023-05-04 13:49:16 · 944 阅读 · 2 评论 -
图神经网络系列教程(1): Supervised graph classification with Deep Graph CNN
这种差异可归因于下面列出的少数因素,-我们使用了不同的训练方案,即对数据进行90/10的单一分割,而不是[1]中使用的重复10倍交叉验证方案。我们的目标是训练一个机器学习模型,该模型使用数据的图形结构以及图形节点可用的任何信息,例如蛋白质中化合物的化学属性,以预测之前未看到的图形的正确标签;DGCNN架构是在[1]中提出的(参见[1]中的图5),使用了[2]中的图卷积层,但修改了传播规则(详见[1])。层,以通过图卷积层的堆栈为每个节点学习的表示作为输入,为每个给定的图生成表示(也称为嵌入)。翻译 2023-04-14 18:04:57 · 715 阅读 · 1 评论 -
《机器学习实战:基于Scikit-Learn、Keras和TensorFlow》第1章 机器学习概览 课后习题
本章中,我们提及了机器学习中最重要的一些概念。第2章将会进行更深入的探讨,也会写更多代码。原创 2023-03-02 14:56:39 · 612 阅读 · 0 评论 -
NetMoss2微生物组网络分析
NetMoss2文献阅读翻译 2023-02-18 21:31:32 · 2126 阅读 · 2 评论 -
三种模型验证方法:holdout, K-fold, leave one out cross validation(LOOCV)
Cross Validation: A Beginner’s GuideAn introduction to LOO, K-Fold, and Holdout model validationBy: Caleb Neale, Demetri Workman, Abhinay Dommalapati源自:https://towardsdatascience.com/cross-validation-a-beginners-guide-5b8ca04962cd文章目录Cross Validation翻译 2022-04-11 20:50:26 · 3984 阅读 · 0 评论 -
递归特征消除(Recursive Feature Elimination)原理与Sklearn实现
递归特征消除(Recursive Feature Elimination)参考:Guyon, I., Weston, J., Barnhill, S., & Vapnik, V., “Gene selection for cancer classification using support vector machines”, Mach. Learn., 46(1-3), 389–422, 2002. https://link.springer.com/article/10.1023/A:1翻译 2022-03-26 20:37:06 · 12669 阅读 · 2 评论 -
snakemake教程-03额外特征
文章目录额外的特征1. Benchmarking(基准测试)2. Modularization(模块化)3.Automatic deployment of software dependencies(自动部署软件依赖项)4. Tool wrappers(工具包装)5. Cluster execution6. Using –cluster-status7.Constraining wildcards额外的特征接下来,我们将介绍更多上面的案例没有包括的特征。更多细节和更多特征,可以参考 Writing Wo翻译 2021-07-04 22:25:28 · 1397 阅读 · 0 评论 -
snakemake教程-02进阶部分
文章目录进阶部分:对案例进行进一步修饰Step 1: Specifying the number of used threadsStep 2: Config filesStep 3: Input functionsStep 4: Rule parametersStep 5: LoggingStep 6: Temporary and protected files练习Summary参考:https://snakemake.readthedocs.io/en/stable/tutorial/advanced翻译 2021-07-04 17:52:52 · 2268 阅读 · 0 评论 -
Snakemake教程-01基础部分
文章目录1. snakemake简介1.1 初识snakemake2. Snakemake教程2.1安装2.2 Basic: An example workflow2.2.1 Step 1: Mapping readsStep 2: Generalizing the read mapping ruleStep 3: Sorting read alignmentsStep 4: Indexing read alignments and visualizing the DAG of jobsStep 5: Ca翻译 2021-07-04 10:45:28 · 5968 阅读 · 0 评论 -
Complex Network Analysis in Python学习笔记
代码下载:https://pragprog.com/titles/dzcnapy/complex-network-analysis-in-python/文章目录Preface1. The Art of Seeing Networks.Part I - Elementary Networks and tools.2. Surveying the Tools of the Craft3. Introducing NetworkXPreface1. The Art of Seeing Networks..翻译 2020-09-13 16:00:31 · 1999 阅读 · 2 评论 -
DNA序列的机器学习方法
参考:https://www.kaggle.com/thomasnelson/working-with-dna-sequence-data-for-ml在生物计算中,处理DNA序列是很常见的。熟悉biopython将能够真正帮助你用python来处理生物序列数据。!pip install biopythonCollecting biopython Downloading https://files.pythonhosted.org/packages/8e/44/3b5b7e68ca414a6.翻译 2020-06-02 15:37:26 · 10439 阅读 · 6 评论 -
python处理taxonomy数据库的fullnamelineage.dmp文件
python处理taxonomy数据库的fullnamelineage.dmp文件#!/home1/jialh/tools/miniconda3/bin/python#PBS -N filter_fullname#PBS -l nodes=1:ppn=8#PBS -l walltime=999999:00:00import osimport csvimport pandas as pdworkdir="/home3/ZXMGroup/MGEs_database/database/Taxo原创 2020-05-19 14:18:27 · 569 阅读 · 0 评论 -
Python并行化处理
原文:Parallel Processing in Python 作者:Frank Hofmann 翻译:Diwei翻译 2019-03-26 17:01:35 · 976 阅读 · 0 评论