![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
紫砂痕
这个作者很懒,什么都没留下…
展开
-
【西瓜书学习笔记】
西瓜书机器学习笔记原创 2023-01-02 16:51:30 · 483 阅读 · 0 评论 -
leetcode交替二进制字符串
0. 交替二进制字符串交替二进制字符串 是指有0,1 构成的、且0,1相间的字符串,比如“010”, “1010”解决的方法,可以遍历两种可能:‘0’开头的交替字符串 或者 ‘1’ 开头的字符串。1. leetcode 1758 生成交替二进制字符串的最少操作数class Solution: def minOperations(self, s: str) -> int: temp1 = 0 temp2 = 0 for i in rang原创 2021-06-06 17:36:22 · 218 阅读 · 0 评论 -
决策树算法梳理-ID3,C4.5, Cart
决策树算法梳理1. ID31. ID3原创 2019-08-12 14:57:23 · 104 阅读 · 0 评论 -
XGBoost算法梳理
XGBoost算法梳理1. 算法原理2. 损失函数3. 分裂结点算法4.正则化5. 对缺失值处理6. 优缺点7. 应用场景8. sklearn参数1. 算法原理2. 损失函数3. 分裂结点算法4.正则化5. 对缺失值处理6. 优缺点7. 应用场景8. sklearn参数...原创 2019-08-12 13:04:10 · 113 阅读 · 0 评论 -
GBDT算法梳理
##GBDT算法梳理前向分布算法负梯度拟合损失函数回归二分类,多分类正则化优缺点sklearn参数应用场景原创 2019-08-11 00:29:54 · 244 阅读 · 0 评论 -
随机森林算法梳理
随机森林算法梳理1. 随机森林原理2. 随机森林的特点3. 代码实现参考链接1. 随机森林原理讲随机森林得从决策树开始讲起, 鉴于决策树容易过拟合的缺点,随机森林采用多个决策树的投票机制(bagging)来改善决策树,也就是 “决策树+bagging=随机森林”。我们假设随机森林使用了m棵决策树,那么就需要产生m个一定数量的样本集来训练每一棵树,如果用全样本去训练m棵决策树显然是不可取的...原创 2019-08-07 21:27:29 · 226 阅读 · 0 评论 -
Kaggle:Elo顾客忠诚度预测问题
Kaggle:Elo顾客忠诚度预测问题1. 问题分析2. 数据预处理3. 特征工程构建4. 训练模型参考链接:Elo顾客忠诚度 —— kaggle数据1. 问题分析这个数据集来自Kaggle这是链接,是Elo(巴西最大的本土支付品牌之一)和Kaggle合作的项目,通过Elo的匿名数据集预测每个客户的忠诚度(具体到card_id),以及查找影响客户忠诚度的因素。这个是数据集是虚构的(官方是这么...原创 2019-03-07 23:22:32 · 1698 阅读 · 0 评论 -
特征选择---理论篇
特征选择1. 过滤(Filter)1.1 点互信息PMI2. 包裹(Warpper)3. 嵌入法(Embedding)一个典型的机器学习任务,是通过样本的特征来预测样本所对应的值。如果样本的特征少了,我们会考虑增加特征,比如Polynomial Regression就是典型的增加特征的算法。但是模型特征越多,模型的复杂度也就越高,越容易导致过拟合。而现实中的情况,往往是特征太多了,需要减少一些“...原创 2019-03-07 21:20:25 · 460 阅读 · 0 评论 -
机器学习之朴素贝叶斯: sklearn.naive_bayes
朴素贝叶斯: sklearn.naive_bayes1. 原理2. sklearn 实现 朴素贝叶斯2.1 代码实习3.2 相关参数参考链接:1. 原理贝叶斯分类是以贝叶斯定理为基础的一种分类算法。已知某条件概率,如何得到事件交换后的概率;即在已知P(A|B)的情况下求得P(B|A)。条件概率P(A|B)表示事件B已经发生的前提下,事件A发生的概率。其基本求解公式为:P(A|B)=P(AB...原创 2019-03-09 18:22:07 · 2204 阅读 · 0 评论 -
机器学习--评价指标:召回率、准确率、ROC曲线、AUC、PR曲线
机器学习-评价指标:召回率、准确率、ROC曲线、AUC、PR曲线1. 混淆矩阵:TP, FP, TN, FN2 准确率(Precision)3 召回率(Recall)4 ROC曲线5 AUU:ROC曲线下的面积6 PR曲线1. 混淆矩阵:TP, FP, TN, FNTrue Positives,TP:预测为正样本,实际也为正样本的特征数False Positives,FP:预测为正样本,...原创 2019-03-03 21:53:49 · 1077 阅读 · 0 评论