![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
猫爱吃鱼the
机器学习爱好者、复杂过程建模控制
展开
-
Lightgbm多余信息显示
[LightGBM] [Warning] No further splits with positive gain, best gain: -inf设置参数‘verbosity’: -1, 或’verbose’: -1原创 2021-02-05 19:42:30 · 4059 阅读 · 2 评论 -
字典学习(KSVD)
1 特征向量知识2 特征值分解3 奇异值分解(SVD)4 字典学习(KSVD)原创 2020-11-09 14:31:33 · 555 阅读 · 0 评论 -
model.fit以及model.fit_generator区别及用法
fit(x=None, y=None, batch_size=None, epochs=1, verbose=1, callbacks=None, validation_split=0.0, validation_data=None, shuffle=True, class_weight=None, sample_weight=None, initial_epoch=0, steps_per_epoch=None, validation_steps=None)以给定数量的轮次(数据集上的迭代)训练模型。原创 2020-06-14 22:21:05 · 9275 阅读 · 2 评论 -
TFIDF如何支持char + word模式,即1-9模式数字模型也支持
什么是TF-IDFTF-IDF(term frequency-inverse document frequency)词频-逆向文件频率。在处理文本时,如何将文字转化为模型可以处理的向量呢?TF-IDF就是这个问题的解决方案之一。字词的重要性与其在文本中出现的频率成正比(TF),与其在语料库中出现的频率成反比(IDF)。TFTF:词频。TF(w)=(词w在文档中出现的次数)/(文档的总词数)IDFIDF:逆向文件频率。有些词可能在文本中频繁出现,但并不重要,也即信息量小,如is,of,that这些单原创 2020-06-06 16:47:26 · 228 阅读 · 0 评论 -
为什么LR模型损失函数使用交叉熵不用均方差?
如果用交叉熵做损失函数,w的梯度是和当前的预测值与实际值的差有关的,没有受到sigmoid函数导数的影响,且真实值与预测值差别越大,梯度越大,更新的速度也就越快,这正是我们想要的。如果用的是均方差作为损失函数,求得的梯度受到sigmoid函数导数的影响...转载 2020-03-17 21:51:19 · 567 阅读 · 0 评论 -
机器学习中正则化项L1和L2的直观理解(深度好文)
L1和L2理解转载 2020-03-16 13:28:54 · 209 阅读 · 0 评论 -
理解sklearn.metrics中roc_auc_score使用方法
AUC原理可看:https://editor.csdn.net/md/?articleId=104838433>>> import numpy as np>>> from sklearn import metrics>>> y = np.array([1, 1, 2, 2])>>> scores = np.array(...原创 2020-03-13 22:34:03 · 12851 阅读 · 1 评论 -
机器学习中的对抗验证
对抗验证交叉验证(Cross Validation)是常用的一种用来评估模型效果的方法。当样本分布发生变化时,交叉验证无法准确评估模型在测试集上的效果,这导致模型在测试集上的效果远低于训练集。通过本文,你将通过一个kaggle的比赛实例了解到,样本分布变化如何影响建模,如何通过对抗验证辨别样本的分布变化,以及有哪些应对方法。直接给链接:https://zhuanlan.zhihu.com/...原创 2020-03-13 20:06:31 · 2205 阅读 · 1 评论 -
如何理解机器学习和统计中的AUC?
1、如何理解机器学习和统计中的AUC?首先,在试图弄懂AUC和ROC曲线之前,一定,一定要彻底理解混淆矩阵的定义!!!混淆矩阵中有着Positive、Negative、True、False的概念,其意义如下:称预测类别为1的为Positive(阳性),预测类别为0的为Negative(阴性)。预测正确的为True(真),预测错误的为False(伪)。对上述概念进行组合,就产生了如下的混淆矩阵:...转载 2020-03-13 12:36:56 · 638 阅读 · 0 评论 -
tensorflow安装经验
参考链接1:https://www.cnblogs.com/HongjianChen/p/8385547.html一定要安装对应的版本比如:1.安装tensorflow 1.8则对应numpy 1.13.3对应keras 2.1.6原创 2020-01-28 14:12:51 · 99 阅读 · 0 评论 -
LightGBM算法总结
https://blog.csdn.net/weixin_39807102/article/details/81912566转载 2019-12-21 11:28:47 · 353 阅读 · 0 评论 -
机器学习--集成学习(Ensemble Learning)深度好文
https://www.cnblogs.com/zongfa/p/9304353.html转载 2019-12-20 13:10:01 · 126 阅读 · 0 评论 -
K-Fold 交叉验证 (Cross-Validation)
在机器学习建模过程中,通行的做法通常是将数据分为训练集和测试集。测试集是与训练独立的数据,完全不参与训练,用于最终模型的评估。在训练过程中,经常会出现过拟合的问题,就是模型可以很好的匹配训练数据,却不能很好在预测训练集外的数据。如果此时就使用测试数据来调整模型参数,就相当于在训练时已知部分测试数据的信息,会影响最终评估结果的准确性。通常的做法是在训练数据再中分出一部分做为验证(Validation...原创 2019-10-23 09:37:45 · 1716 阅读 · 0 评论