机器学习
文章平均质量分 91
一点点进步!
林立可
加点油呢!路还有那么长!
展开
-
相见恨晚!一文搞清XGBoost算法
XGBoost算法1,算法简介XGBoost(Extreme Gradient Boosting),即一种高效的梯度提升决策树算法。他在原有的GBDT基础上进行了改进,使得模型效果得到大大提升。作为一种前向加法模型,他的核心是采用集成思想——Boosting思想,将多个弱学习器通过一定的方法整合为一个强学习器。即用多棵树共同决策,并且用每棵树的结果都是目标值与之前所有树的预测结果之差 并将所有的结果累加即得到最终的结果,以此达到整个模型效果的提升。XGBoost是由多棵CART(Classificat原创 2021-04-07 11:37:08 · 43352 阅读 · 7 评论 -
(一)线性回归理论及实现
线性回归1,概述线性回归是机器学习最基本的回归算法之一,通过对自变量和因变量之间的关系进行建模,找出一个拟合最好的线性关系函数。而根据自变量的多少,又可以分为一元回归和多元回归。2,算法推导假设银行的贷款额度和借贷人的年龄、薪资水平有关,现在希望根据一组数据,使得我们能够确定出三者之间的线性关系并由此做出合理的借贷额度预测。这里有函数:hθ(x)=θ0+θ1x1+θ2x2 h_{\theta}(x)=\theta_{0}+\theta_{1} x_{1}+\theta_{2} x_{2} hθ(原创 2020-08-01 16:09:50 · 1337 阅读 · 0 评论 -
(2021年3月)Datawhale数据挖掘挑战赛TASK2 数据分析
import warningswarnings.filterwarnings('ignore')import missingno as msnoimport pandas as pdfrom pandas import DataFrameimport matplotlib.pyplot as plt import seaborn as snsimport numpy as npimport pandas as pdfrom pandas import DataFrame, Series翻译 2021-03-19 19:15:56 · 281 阅读 · 0 评论 -
(2021年3月)Datawhale数据挖掘挑战赛TASK1 baseline
参加Datawhale数据挖掘挑战赛——零基础入门数据挖掘(心跳信号分类)的学习笔记比赛地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/HeartbeatClassificationimport osimport gcimport mathimport pandas as pdimport numpy as npimport lightgbm as lgbimport xgboost a翻译 2021-03-17 13:48:12 · 286 阅读 · 0 评论 -
(2021年3月)Datawhale数据挖掘挑战赛TASK0 赛题理解
Datawhale 零基础入门数据挖掘-Task0 赛题理解Task0赛题理解Tip:本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第五场 —— 零基础入门心电图心跳信号多分类预测挑战赛。2016年6月,国务院办公厅印发《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》,文件指出健康医疗大数据应用发展将带来健康医疗模式的深刻变化,有利于提升健康医疗服务效率和质量。赛题以心电图数据为背景,要求选手根据心电图感应数据预测心跳信号,其中心跳信号对应正常病例以及受不同心律不齐和转载 2021-03-17 13:39:18 · 326 阅读 · 0 评论