2021年02月_星海千寻

12月 09月 08月 02月 01月

原创《scikit-learn》朴素贝叶斯

在scikit-learn中，优这么集中朴素贝叶斯naive_bayes.BernoulliNB 伯努利分布下的NBnaive_bayes.GaussianNB 高斯分布下的NBnaive_bayes.MultinomialNB 多项式分布下的NBnaive_bayes.ComplementNB 补充NB一：高斯朴素贝叶斯通过假设P(xi | Y)是服从于高斯分布的。它会自动计算某个Y的条件下，某个特征的的均值和方差，然后代入具体值的话就是得到了具体的条件概率。它适用于连续变量。# 高

2021-02-17 20:09:19 651

原创《scikit-learn》xgboost

XGBoost算法• XGBoost是陈天奇等人开发的一个开源机器学习项目，高效地实现了GBDT算法并进行了算法和工程上的许多改进，被广泛应用在Kaggle竞赛及其他许多机器学习竞赛中并取得了不错的成绩。• XGBoost的基学习器除了可以是CART（这个时候就是GBDT）也可以是线性分类器，而GBDT只能是CART。• XGBoost的目标函数的近似用了二阶泰勒展开，模型优化效果更好。• XGBoost在代价函数中加入了正则项，用于控制模型的复杂度(正则项的方式不同，如果你仔细点话，GBDT是一

2021-02-17 16:13:45 592 2

原创《scikit-learn》SVM（三）ROC曲线

当我们越来越追求较高的recall的时候，precision会下降，就是说随着越来越多的少数类被捕获出来，就会伴随着更多的多数类被判断错误，我们想知道随着追求的recall的增加，模型把多数类判断错误的现象的将如何变化；或者说啊，我们每多找出一些少数类，就会把多少多数类样本给判断错误。因此我们可以使用Recall和假正率FPR之间的平衡，来代替Recall和precision之间的平衡，因此这种，衡量模型在尽量捕获少数类的时候，造成对多数类样本错误判断情况的变化曲线，我们称之为ROC（The Rece

2021-02-17 02:46:02 4289

原创《scikit-learn》SVM（二）数据不均衡

我们继续学习一些其他的细节一：样本均衡问题我们来看看在SVM中样本不均衡的情况比如两个样本集合的数目严重不对等，我们希望模型更能识别出少数样本，比如银行贷款，预测某人会不会抵赖，我们更希望能预测出抵赖的人，防止损失吧，大多数人是不会抵赖的，递来的人就是少数。在这样的分布下，即便我们什么都不做，全部预测是不会抵赖，那么模型的准确度也是很高的，这样是没有任何意义，我们需要重点关注的是那部分少数的样本。我们用class_weight来改变样本的分布权重比例。同时我们也可以用sample_weight来

2021-02-16 16:37:13 2071

原创《scikit-learn》SVM（一）

至于SVM的数学理解，强烈推荐如下三篇知乎博文，我是自学视频学习的，但是如下三篇博文讲的是真的好啊，完全跟我在视频里学习到的是一样的，我很激动啊。https://zhuanlan.zhihu.com/p/28660098https://zhuanlan.zhihu.com/p/28954032https://zhuanlan.zhihu.com/p/77750026这三篇写的真的是用心极力推荐啊。我就不自己重复工作了，为了搞懂这点，或者说初步搞懂这点，我花了两天的时间，因为自己的数学能力有点薄弱。

2021-02-15 18:54:12 322 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

qq_29367075的博客

原创《scikit-learn》朴素贝叶斯

原创《scikit-learn》xgboost

原创《scikit-learn》SVM（三）ROC曲线

原创《scikit-learn》SVM（二）数据不均衡

原创《scikit-learn》SVM（一）

原创《scikit-learn》KMeans

原创《scikit-learn》PCA（一）

原创《scikit-learn》数据预处理与特征工程（三）特征选择

原创《scikit-learn》数据预处理与特征工程（二）数值转换

原创《ML》方差和偏差

原创《scikit-learn》数据预处理与特征工程（一）数据归一化

原创《scikit-learn》随机森林之分类预测乳腺癌模型

原创《scikit-learn》随机森林回归填补缺失值

原创《scikit-learn》随机森林之回归

原创《scikit-learn》随机森林之深入学习

原创《scikit-learn》随机森林之分类树

每天进步一点点《ML - 异常点检测》.docx

每天进步一点点《ML - K-Means》.docx

每天进步一点点《ML - 支持向量机》.docx

每天进步一点点《ML - 人工神经网络》.docx

每天进步一点点《ML - 线性回归》.docx

学习OpenCV(中文版)).pdf

空空如也