【特征工程常用思路】人工智能辅助糖尿病遗传风险预测项目总结【LGB|XGB|神经网络】

206 篇文章 263 订阅 ¥19.90 ¥99.00
90 篇文章 217 订阅 ¥19.90 ¥99.00
43 篇文章 155 订阅 ¥19.90 ¥99.00
本文总结了一个利用人工智能进行糖尿病遗传风险预测的项目,探讨了LightGBM、XGBoost和Keras在预测算法中的应用。LightGBM和XGBoost基于梯度提升决策树,通过优化算法提高预测效率和精度,而Keras作为深度学习框架,用于构建神经网络模型。针对数据不平衡问题,文章提出了模型融合策略,通过加权和数据筛选提升高血糖样本的预测准确性。
摘要由CSDN通过智能技术生成

预测算法


1. LightGBM
  LightGBM利用基于histogram的算法,通过将连续特征(属性)值分段为discrete bins来加快训练的速度并减少内存的使用。直方图算法的基本思想:先把连续的浮点特征值离散化成k个整数,同时构造一个宽度为k的直方图。遍历数据时,根据离散化后的值作为索引在直方图中累积统计量,当遍历一次数据后,直方图累积了需要的统计量,然后根据直方图的离散值,遍历寻找最优的分割点。基于histogram算法有很多优点,包括减少分割增益的计算量、通过直方图的相减来进行进一步的加速、减少内存的使用、减少并行学习的通信代价等。
  Gradient Boosting Decision Tree(GBDT)是一种被广泛使用的算法,目前也有很多实现方法,比如说scikit-learn,LightGBM。其实关于梯度提升树不同的实现,本质就是所使用的损失函数和最小化损失函数的方法有所差异。而梯度提升算法的核心思想就是通过拟合负梯度值去学习决策树。
  相关代码如下,仍需要根据实际应用做出相应的更改。



import time
import datetime
import numpy as np
import pandas as pd
im
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

南七小僧

打赏后,可以添加微信一对一咨询

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值