机器学习
噶噶~
这个作者很懒,什么都没留下…
展开
-
python绘制决策树
【代码】python绘制决策树。原创 2024-02-03 10:50:54 · 992 阅读 · 1 评论 -
求解神经网络做十字交叉验证k=10,这种方法到底是得到十个模型还是一个模型
求解神经网络做十字交叉验证k=10,这种方法到底是得到十个模型还是一个模型原创 2023-04-19 17:21:48 · 319 阅读 · 0 评论 -
python实现K-means的代码
python实现K-means的代码原创 2022-07-22 10:36:06 · 712 阅读 · 0 评论 -
XGboost常见特征处理及其他问题
1. Bagging 和Boosting区别 RF,GBDT,XGBoost,lightGBM都属于集成学习(EnsembleLearning),集成学习的目的是通过结合多个基学习器的预测结果来改善基本学习器的泛化能力和鲁棒性。(1)形式上 Bagging:基本学习器之间存在强依赖关系、必须串行生成的序列化方法; 例如:随机森林 bagging主要关注降低方差 Boosting:基本学习器间不存在强依赖关系、可同时原创 2022-05-30 11:04:23 · 2979 阅读 · 4 评论 -
简述AutoML由来与其应用现状
参考链接:https://zhuanlan.zhihu.com/p/57404166原创 2021-09-22 23:07:02 · 82 阅读 · 0 评论 -
XGBoost的原理
这是一篇个人看到讲的最好的文章:https://blog.csdn.net/lamusique/article/details/96478351原创 2021-08-12 12:41:27 · 54 阅读 · 0 评论 -
Adaboost, GBDT 与 XGBoost 的区别
简而言之,GBDT和XGBOOST的区别在于:参考连接:https://zhuanlan.zhihu.com/p/42740654原创 2021-08-09 01:55:38 · 112 阅读 · 0 评论 -
K-means算法的参数详解
参数名称 默认值及输入类型 参数解释 algorithm 默认:Auto 有auto、full和elkan三种选择。 algorithm: 优化算法的选择,有auto、full和elkan三种选择。 full就是一般意义上的K-Means算法, elkan是使用的elkan K-Means算法。 auto则会根据数据值是否是稀疏的(稀疏一般指是有大量缺失值),来...原创 2020-11-24 11:51:51 · 3450 阅读 · 1 评论 -
windows下安装Keras(CPU版)
原文:https://blog.csdn.net/u012735708/article/details/82689281转载 2019-06-13 15:56:01 · 1027 阅读 · 0 评论 -
吴恩达-模型优化/正则化
1. 模型优化 常用的模型优化的方式重要有两种方式,正规方程和梯度下降。 (1)正规方程 和梯度下降不同的是在于求出代价函数最小时的参数值的方式不同。通常用于线性回归问题。 (2)梯度下降 首先建立一个代价函数,然后快速找到代价函数最小的一系列参数值的过程。 我们开始随机的选择一系列的参数值...原创 2019-05-31 22:29:45 · 227 阅读 · 0 评论 -
如何理解特征值和特征向量
参考链接:https://blog.csdn.net/ljhandlwt/article/details/76576915转载 2019-05-26 21:41:09 · 1059 阅读 · 0 评论 -
lightgbm,xgboost,gbdt的区别与联系
今天是周末,之前给自己定了一个小目标:每周都要写一篇博客,不管是关于什么内容的都行,关键在于总结和思考,今天我选的主题是梯度提升树的一些方法,主要从这些方法的原理以及实现过程入手讲解这个问题。本文按照这些方法出现的先后顺序叙述。GBDT梯度提升树实在提升树的基础上发展而来的一种使用范围更广的方法,当处理回归问题时,提升树可以看作是梯度提升树的特例(分类问题时是不是特例?)。 因为提升树...原创 2018-12-11 22:35:39 · 171 阅读 · 0 评论 -
GBDT为什么比决策树结果更优?从决策树到随机森林再到GBDT,模型是怎么优化的?
决策树在计算过程中,已经通过信息增益或基尼系数理论使得决策树能够使得损失函数最小化了,为什么GBDT能够获得更好的结果?是决策树没有对数据信息利用充分吗?决策树,是通过计算信息增益的方式构建决策树。但是随机森林和GBDT的模型往往能能获得比决策树更优的模型结果,难道说信息增益理论并不能得到最大的信息量吗?首先我们来看为什么随机森林能够获得比单棵树更优的结果。随机森林是通过对模型进行重采样的...原创 2019-01-24 16:12:16 · 502 阅读 · 0 评论 -
LightGBM 如何调参
本文结构:什么是 LightGBM 怎么调参 和 xgboost 的代码比较1. 什么是 LightGBMLight GBM is a gradient boosting framework that uses tree based learning algorithm.LightGBM 垂直地生长树,即 leaf-wise,它会选择最大 delta loss 的叶子来增长。...原创 2019-01-23 13:51:08 · 256 阅读 · 0 评论 -
XGBoost和LightGBM的参数以及调参
一、XGBoost参数解释XGBoost的参数一共分为三类:通用参数:宏观函数控制。 Booster参数:控制每一步的booster(tree/regression)。booster参数一般可以调控模型的效果和计算代价。我们所说的调参,很这是大程度上都是在调整booster参数。 学习目标参数:控制训练目标的表现。我们对于问题的划分主要体现在学习目标参数上。比如我们要做分类还是回归,做...原创 2019-01-23 14:46:37 · 1105 阅读 · 0 评论 -
生产环境中进行机器学习模型部署(using Flask)
我们原来一直看的文章,大都是在讲机器学习原理、如何构造特征、如何调参之类的,但是实际中模型是如何进行部署的呢?下面的这篇文章就是在讲用Flask框架进行模型部署(注明:这篇文章基本是翻译国外大神的著作,如果英文不错建议直接看原作,英文不好的话也要尽量看下原作)文章目录:部署机器模型的选择 什么是APIs? Flask基础 创建一个机器学习模型 保存机器学习模型:序列化和反序列化 ...转载 2019-03-05 21:02:25 · 1225 阅读 · 0 评论 -
python求众数、中位数、均值
首先需要数据源,这里随便写了一个:[python]view plaincopynums=[1,2,3,4]求均值和中位数均可以使用numpy库的方法:[python]view plaincopyimportnumpyasnp #均值 np.mean(nums) #中位数 np.median(nums)求众...原创 2019-03-19 17:31:16 · 1277 阅读 · 0 评论 -
python多线程
参考链接https://www.cnblogs.com/yeayee/p/4952022.html转载 2019-03-15 14:17:00 · 62 阅读 · 0 评论 -
pandas 入门:DataFrame的创建,读写,插入和删除
连接:https://blog.csdn.net/xtfge0915/article/details/52938740转载 2019-03-20 16:43:54 · 101 阅读 · 0 评论 -
log和box-cox变换
1. 通常对于y进行log变换,因为诸如线性模型、SVM等要求target variable是服从正态分布的2. 对于特征值服从偏态分布的,可以使用box-cox进行变换,可使用from scipy.special import boxcox1p当λ=0时,使用log变换当λ=1时,相当于对x进行平移,得到x-1详见 http://onlinestatbook.com/2/t...原创 2019-03-25 10:16:29 · 1704 阅读 · 0 评论 -
PCA的推导
https://blog.csdn.net/weixin_38314865/article/details/84190175转载 2019-05-20 21:39:22 · 105 阅读 · 0 评论 -
PyTorch的基本概念
什么是Pytorch,为什么选择Pytroch? (1) 什么是Pytorch Torch 自称为神经网络界的 Numpy, 因为他能将 torch 产生的 tensor 放在 GPU 中加速运算 (前提是你有合适的 GPU), 就像Numpy 会把 array 放在 CPU 中加速运算. 所以神经网络的话, 当...原创 2019-05-12 20:44:21 · 285 阅读 · 0 评论 -
协方差矩阵的理解
转载自:https://www.cnblogs.com/chaosimple/p/3182157.html【嵌牛导读】:本文主要是介绍对协方差矩阵的理解.【嵌牛鼻子】:协方差矩阵【嵌牛提问】:怎样理解协方差矩阵?【嵌牛正文】:这两天看主成分分析算法时,里面出现了个协方差矩阵的概念。协方差矩阵是啥个意思也不知道,所以就在网上搜索了下,发现有个讲的挺细的,所以就在这拿出来了。数学...原创 2019-05-26 21:17:06 · 499 阅读 · 0 评论 -
开源|LightGBM基本原理,以及调用形式
久前微软 DMTK (分布式机器学习工具包)团队在 GitHub 上开源了性能超越其他 boosting 工具的 LightGBM 知乎上有近千人关注“如何看待微软开源的 LightGBM?”问题,被评价为“速度惊人”,“非常有启发”,“支持分布式”,“代码清晰易懂”,“占用内存小”等。GBDT : GBDT (Gradient Boosting Decision Tree) 是机器学...原创 2018-12-12 22:00:40 · 626 阅读 · 0 评论