python生物信息学
文章平均质量分 86
python机器学习建模
这个作者很懒,什么都没留下…
展开
-
微软可解释性模型Explainable Boosting Machine (EBM)
微软可解释性模型Explainable Boosting Machine (EBM)原创 2024-06-05 11:13:59 · 947 阅读 · 0 评论 -
金融风控模型论文定制服务_研究生博士生毕业论文_小论文_中文核心_CCF_EI会议_AI_人工智能_机器学习
金融风控模型论文定制服务_研究生博士生毕业论文_小论文_中文核心_CCF_EI会议_AI_人工智能_机器学习原创 2024-06-05 11:11:09 · 450 阅读 · 0 评论 -
科研论文必须要了解的27个学术网站-人工智能机器学习
科研论文必须要了解的27个学术网站原创 2024-05-04 17:36:55 · 2519 阅读 · 0 评论 -
Python机器学习SCI论文复现-15大经典案例
Python机器学习SCI论文复现-15大经典案例原创 2024-04-26 10:50:29 · 1851 阅读 · 0 评论 -
python机器学习-乳腺癌细胞挖掘和生存分析(2024年新版)
python机器学习-乳腺癌细胞挖掘和生存分析(2024年新版)原创 2024-04-08 20:07:38 · 843 阅读 · 0 评论 -
美国国立癌症研究所数据库乳腺癌生存分析和乳腺癌预测模型NCI SEER breast cancer(2024年新项目)
NCI SEER breast cancer美国国立癌症研究所数据库乳腺癌生存分析和乳腺癌预测模型(2024年新项目)原创 2024-04-08 20:03:11 · 1027 阅读 · 0 评论 -
python机器学习-糖尿病数据挖掘_2024年版(三个实战案例,附代码数据)
python机器学习-糖尿病数据挖掘_2024年版(三个实战案例,附代码数据)原创 2024-04-08 19:59:43 · 1063 阅读 · 0 评论 -
融合模型stacking14条经验总结和5个成功案例(互联网最全,硬核收藏)_机器学习_人工智能_模型竞赛_论文参考
融合模型stacking14条经验总结和5个成功案例(互联网最全,硬核收藏)_机器学习_人工智能_模型竞赛_论文参考原创 2023-06-18 11:09:42 · 3918 阅读 · 1 评论 -
机器学习建模-糖尿病肾病预测模型
机器学习建模-糖尿病肾病预测模型原创 2023-04-06 21:17:51 · 7346 阅读 · 1 评论 -
糖尿病数据独家挖掘-基于上百万临床实验数(收藏)
糖尿病数据独家震撼挖掘-基于上百万临床实验数原创 2023-03-25 13:27:05 · 7232 阅读 · 2 评论 -
《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-企业科研_论文作业
《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业原创 2023-03-21 20:12:09 · 2858 阅读 · 0 评论 -
机器学习糖尿病预测模型-美国疾控中心CDC25万数据集,生物医药企业科研_论文作业_专利
人工智能糖尿病预测模型-美国疾控中心CDC25万数据集,生物医药企业科研_论文作业_专利原创 2023-03-19 13:52:16 · 4119 阅读 · 6 评论 -
糖尿病预测模型-Pima印第安人数据集-论文_企业科研
糖尿病预测模型-Pima印第安人数据集-论文_企业科研原创 2023-03-19 11:11:25 · 4573 阅读 · 2 评论 -
AI人工智能肺炎图像识别模型-企业模型_科研机构应用
AI人工智能肺炎图像识别模型-企业模型_科研机构应用原创 2023-03-15 09:58:37 · 4610 阅读 · 3 评论 -
大数据挖掘-伤寒论和金匮要略(COVID-19用药启示录,1.4万字收藏)
大数据挖掘-伤寒论和金匮要略大数据挖掘-伤寒论和金匮要略大数据挖掘-伤寒论和金匮要略原创 2023-01-04 21:25:56 · 10629 阅读 · 2 评论 -
大数据挖掘-使用频率top20中药材(收藏)
大数据挖掘-使用频率top20中药材(万字,收藏)原创 2022-12-30 21:52:22 · 10979 阅读 · 3 评论 -
机器学习肝炎预测模型machine learning for hepatitis prediction model
机器学习肝炎预测模型machine learning for hepatitis prediction model原创 2022-12-23 12:37:22 · 12778 阅读 · 3 评论 -
机器学习模型-BUPA liver disorders-探索饮酒与肝炎关系
机器学习模型-BUPA liver disorders-探索饮酒与肝炎关系原创 2022-12-22 12:09:14 · 7473 阅读 · 3 评论 -
心脏病_冠心病智能预测模型(人工智能,机器学习,用于论文作业_专利_企业建模__项目申报_科研报告,收藏)
心脏病_冠心病智能预测模型(人工智能,机器学习,可用于论文作业_专利_企业建模__项目申报_科研报告原创 2022-12-20 12:12:59 · 5567 阅读 · 2 评论 -
药品名智能分类模型(化药_中成药_中药材)
药品名分类是一件很复杂的事情。我们将从天然矿物、动植物中提取的有效成分,以及经过化学合成或生物合成而制得的药物,统称为化学药物。中药=中成药(俗称中药)+药材+中药饮片。中药饮片为特殊中药材,根据《药典》定义饮片是指经过加工炮制的中药材,可直接用于调配或制剂”。生物药物是指运用微生物学、生物学、医学、生物化学等的研究成果,从生物体、生物组织、细胞、体液等,综合利用微生物学、化学、生物化学、生物技术、药学等科学的原理和方法制造的一类用于预防、治疗和诊断的制品。药用辅料系指生产药品和调配处方时使用的赋形剂和附加原创 2022-05-30 15:49:20 · 1808 阅读 · 3 评论 -
2022 年您必须关注的 8 个python数据科学神器
在公众号「python风控模型」里回复关键字:学习资料 QQ学习群:1026993837 领学习资料 2022年我谈到了八个可能会成为数据和 机器学习 领域增长最快的库。1️⃣。SHAPSHAP是机器学习可解释性的工具,打破了机器学习不可解释的神话。就像评分卡模型,其它机器学习算法也可以分析变量的业务意义。不久前,我在 LinkedIn 上看到了这篇文章,它彻底改变了我对 AI 的看法:最强大的语言模型之一原创 2022-02-04 10:28:13 · 1861 阅读 · 1 评论 -
如何使用UMAP分析100维数据,惊艳令人叹为观止
在公众号「python风控模型」里回复关键字:学习资料 QQ学习群:1026993837 领学习资料 介绍无论机器学习模型多么强大,它们都无法完全击败您在那些“啊哈!”中获得的感觉。通过丰富的视觉效果探索数据的时刻。但是,在你说“这真的变老了”之前,你可以创建很多直方图、散点图、热图。在那些时刻,你需要一些东西来提醒你数据是多么的惊人和迷人。您需要从 FlowingData 或相关子版块中的杰作视觉效果中获原创 2022-02-04 09:58:34 · 3506 阅读 · 1 评论 -
基线理解_SHAP的变量解释性绘图理解与应用
SHAP的理解与应用 SHAP有两个核心,分别是shap values和shap interaction values,在官方的应用中,主要有三种,分别是force plot、summary plot和dependence plot,这三种应用都是对shap values和shap interaction values进行处理后得到的。下面会介绍SHAP的官方示例,以及我个人对SHAP的理解和应用。 1. SHAP官方示例 首先简单介绍下shap values和shap inte...转载 2022-01-08 13:28:26 · 19778 阅读 · 2 评论 -
机器学习黑盒?SHAP(SHapley Additive exPlanations)使用 XGBoost 的可解释机器学习
在公众号「python风控模型」里回复关键字:学习资料QQ学习群:1026993837 领学习资料模型可解释性这是一个关于错误解释机器学习模型的危险以及正确解释它的价值的故事。如果您发现诸如梯度提升机或随机森林之类的集成树模型的鲁棒准确性很有吸引力,但也需要解释它们,那么我希望您发现这些信息有用且有帮助。试想一下,我们的任务是预测个人Ô为n行的财务状况。我们的模型越准确,银行赚的钱就越多,但由于此预测用于贷款申请,因此法律上也要求我们解释为什么做出预测。在对多种模型类型进行试验后,我们发现 XGBoost原创 2022-01-06 13:51:50 · 2815 阅读 · 1 评论 -
解释性差?机器学习解释利器:SHAP原理及实战
武汉加油 热干面,你要好起来啊!本文首发于公众号:AI小老弟,全文约5000字,阅读时长5-10分钟导读本文首先介绍了机器学习解释包SHAP原理和计算方法,然后基于kaggle竞赛Home Credit数据构建用户违约预测的二分类模型,实战演练了SHAP的几个常用功能。针对结构化的数据以及分类任务,集成模型往往会有较好的效果,如XGBOOST的诞生,不仅风靡各大数据竞赛,也在工程中得到了广泛的应用。对于集成学习方法,效果虽好,但一直无法解决可解释性的问题。我们知道一个xgboost或lightgbm模型,转载 2022-01-05 10:40:01 · 9381 阅读 · 3 评论 -
SHAP(SHapley Additive exPlanation):Python的可解释机器学习库
可解释机器学习在这几年慢慢成为了机器学习的重要研究方向。作为数据科学家需要防止模型存在偏见,且帮助决策者理解如何正确地使用我们的模型。越是严苛的场景,越需要模型提供证明它们是如何运作且避免错误的证据关于模型解释性,除了线性模型和决策树这种天生就有很好解释性的模型意外,sklean中有很多模型都有importance这一接口,可以查看特征的重要性。其实这已经含沙射影地体现了模型解释性的理念。只不过传统的importance的计算方法其实有很多争议,且并不总是一致。有兴趣可以之后阅读相关文章 permutati转载 2022-01-05 10:29:56 · 20249 阅读 · 5 评论 -
micro macro 区别和详解
micro-F1和macro-F1详解 摘要micro-F1:macro-F1:weighted-F1调参 摘要 F1-score:是统计学中用来衡量二分类模型精确度的一种指标,用于测量不均衡数据的精度。它同时兼顾了分类模型的精确率和召回率。F1-score可以看作是模型精确率和召回率的一种加权平均,它的最大值是1,最小值是0。 在多分类问题中,如果要计算模型的F1-score,则有两种计算方式,分别为micro-F1和macro-F1,这两种计算...转载 2022-01-04 19:46:01 · 5818 阅读 · 0 评论 -
SVM支持向量和逻辑回归的decision_function用法详解
在使用sklearn训练完分类模型后,下一步就是要验证一下模型的预测结果,对于分类模型,sklearn中通常提供了predict_proba、predict、decision_function三种方法来展示模型对于输入样本的评判结果。 说明一下,在sklearn中,对于训练好的分类模型,模型都有一个classes_属性,classes_属性中按顺序保存着训练样本的类别标记。下面是使用Logistic Regression分类器在为例,展示一下分类器的class...转载 2022-01-04 18:25:11 · 9757 阅读 · 2 评论 -
feature tools:Python 中的自动化特征工程
特征工程基础特征工程意味着从现有数据中构建附加特征,这些数据通常分布在多个相关表中。特征工程需要从数据中提取相关信息并将其放入单个表中,然后可用于训练机器学习模型。构建特征的过程非常耗时,因为每个新特征通常需要几个步骤来构建,尤其是在使用来自多个表的信息时。我们可以将特征创建的操作分为两类:转换和聚合。让我们看几个例子,看看这些概念的实际应用。一个转化作用于单个表(思维在Python而言,表只是一个熊猫DataFrame通过创建新的功能出来的一个或多个现有列)。例如,如果我们有下面的客户表我们可以通过查找j原创 2022-01-04 14:58:24 · 1815 阅读 · 0 评论 -
python自动机器学习库auto_ml模块
在公众号「python风控模型」里回复关键字:学习资料什么是 AutoML?自动化机器学习提供了方法和流程,使非机器学习专家可以使用机器学习,以提高机器学习的效率并加速机器学习的研究。近年来,机器学习 (ML) 取得了相当大的成功,并且越来越多的学科依赖它。然而,这种成功在很大程度上依赖于人类机器学习专家来执行以下任务:预处理和清理数据。选择并构建适当的特征。选择合适的模型族。优化模型超参数。设计神经网络的拓扑结构(如果使用深度学习)。后处理机器学习模型。批判性地分析获得的结果。由于这些任务的复杂性通常超出原创 2021-12-12 22:19:27 · 2408 阅读 · 1 评论 -
Focal Loss 和 LightGBM 多分类应用-python实现
在公众号「python风控模型」里回复关键字:学习资料有几种方法可以将 Focal Loss 合并到多类分类器中。这是其中之一。动机许多现实世界的分类问题都有不平衡的类分布。当数据严重不平衡时,分类算法将开始做出有利于多数类的预测。有几种方法可以解决类别不平衡问题。一种方法是分配与类频率成反比的样本权重,以增加较少频率类在损失函数中的贡献。另一种方法是使用过采样/欠采样技术。为少数类生成人工样本的流行技术是合成少数类过采样技术 (SMOTE) 和自适应合成 (ADASYN),两者都包含在 imblearn原创 2021-12-12 21:46:56 · 4537 阅读 · 3 评论 -
LightGBM 二元分类、多类分类、 Python的回归和分类器应用
在公众号「python风控模型」里回复关键字:学习资料LightGBM是一个梯度提升框架,它使用基于树的学习算法。与其他提升算法相比,它被设计为分布式且高效。可以用于比较的模型是 XGBoost,它也是一种提升方法,与其他算法相比,它的表现非常出色。然而XGBoost是数据集的好算法升超过10000行ESS,对于大型数据集,所以不推荐。而LightGBM可以处理大量数据, 占用内存少,具有并行和GPU 学习,准确率好,训练速度和效率更快。那么是什么让 LightGBM 成为一个更好的模型原创 2021-12-12 21:43:05 · 7745 阅读 · 0 评论 -
生物信息学中的机器学习:使用K-Means和PCA进行基因组序列分析 COVID-19接下来如何突变?
生物信息学中的机器学习:使用K-Means和PCA进行基因组序列分析 COVID-19接下来如何突变?转载 2021-12-03 18:31:37 · 998 阅读 · 0 评论 -
Python绘图新冠病毒COVID-19
在全球范围内,截至2021 年 11 月 15 日欧洲中部时间下午 4:30,各国已向世卫组织报告了253,163,330(2.5亿)例COVID-19确诊病例,包括5,098,174(5百万)例死亡。截至2021 年 11 月 14 日,共接种了7,307,892,664(73亿)剂疫苗。下图是全球新冠死亡人数分布我们用python的turtle库绘制新冠病毒,简单卡哇伊模仿,莫见笑!import turtleturtle.setup(650,650,300,300)turtle.p原创 2021-11-17 12:35:15 · 1402 阅读 · 1 评论 -
python新冠病毒COVID-19数据分析和数据可视化
在公众号「python风控模型」里回复关键字:学习资料在全球范围内,截至2021 年 11 月 15 日欧洲中部时间下午 4:30,各国已向世卫组织报告了253,163,330(2.5亿)例COVID-19确诊病例,包括5,098,174(5百万)例死亡。截至2021 年 11 月 14 日,共接种了7,307,892,664(73亿)剂疫苗。下图是不同时间的确诊病例和死亡人数通过不同颜色可视化,我们可以明显发现新冠病毒感染主要发生在美洲和欧洲。使用所有这些分类变量,将生成变量中每个标签的组合,因此总共创建原创 2021-11-17 11:58:27 · 20744 阅读 · 4 评论 -
python乳腺癌细胞挖掘
随着人们生活水平提高,大家不仅关注如何生活,而且关注如何生活得更好。在这个背景下,精准治疗和预测诊断成为当今热门话题。据权威医学资料统计,全球大约每13分钟就有一人死于乳腺癌,乳腺癌已成为威胁当代人健康的主要疾病之一,并且随着发病率的增加,死亡率也逐渐增加,作为女性实在不能不重视。其中前十位死因;女性乳腺癌为首因,其余顺序与全人群死因一致。其中,乳腺癌可能没有任何先兆,是一个隐形杀手。有不少人的乳腺癌是没有任何征兆的,有可能只是发现肿块但没有任何不舒服的地方,但一检查就确诊乳腺癌的情况不在少数,更甚原创 2021-11-09 17:42:45 · 13832 阅读 · 1 评论 -
python糖尿病数据挖掘
有人说21世纪,我们的生活越来越便捷,电子通讯越来越发达,美食越来越多。这一点也不假。但现代生活方式也有不利一面,工作越来越忙,身体锻炼越来越少,体重一天一天增加。有一种疾病叫做糖尿病,你们听说过吗?餐饮行业为了增加销售量,会增加食物食盐量。这样可以满足顾客重口味。饮料厂商为了增加销售量,在饮料里添加不少糖分(碳水化合物)。糖可以刺激大脑,形成正反馈,越喝越想喝,形成对糖依耐性。996对程序员并不陌生,一天工作太忙,下班后就葛优躺,拿着手机或看电视。体重一天天增加,我想说的是糖尿病离你还原创 2021-11-09 17:28:57 · 10951 阅读 · 1 评论 -
Python入门经典学习1-乳腺癌分类问题
基于肿瘤特征判定是恶性肿瘤还是良性肿瘤,通过研究699个患者的肿瘤属性,找到肿瘤预测模式,根据肿瘤属性来判定肿瘤性质,对没有见过见过面的患者,根据属性来判定是否为恶性肿瘤。############################################ 分类器:肿瘤良性还是恶性########################################### 相关资料:入口1https://ke.qq.com/course/3064292入口2https://s转载 2021-11-09 17:24:52 · 711 阅读 · 1 评论 -
为癌症生存数据集开发神经网络
python风控模型 持牌照金融公司模型专家,教学主页 https://ke.qq.com/teacher/231469242?tuin=dcbf0ba 150篇原创内容 ...原创 2021-10-24 20:45:32 · 3553 阅读 · 0 评论 -
XGBoost 损失函数Loss Functions
在公众号「python风控模型」里回复关键字:学习资料,就可免费领取。 python风控模型 持牌照金融公司模型专家,教学主页 https://ke.qq.com/teacher/231469242?tuin=dcbf0原创 2021-10-07 12:14:58 · 5529 阅读 · 0 评论