sklearn
文章平均质量分 96
不会统计的大河马
本科统计学|研究生应用统计
python、SQL、R、SAS
小红书同名学习博主
展开
-
集成学习之Bagging与随机森林(ensemble learning)
集成学习里面的随机森林,用交叉验证来计算随机森林解决决策树的过拟合问题。用随机森林解释普通学习和增量学习的区别,增量学习是新数据训练模型之后,模型仍然记得原来的树。原创 2022-09-25 20:34:15 · 989 阅读 · 0 评论 -
Sklearn机器学习——预测明天是否会下雨
探索澳大利亚天气,进行特征工程时对于地点这个特征进行爬虫爬取,使之与气候站的天气进行关联。数据预处理也比较繁琐。后期进行建模对于准确度和recall都进行不断优化。算是难度比较大的一个svm案例。原创 2022-09-07 23:07:27 · 4343 阅读 · 5 评论 -
Sklearn机器学习——ROC曲线、ROC曲线的绘制和AUC面积、运用ROC曲线找到最佳阈值
介绍了如何平衡分类正确率和误判多数变成小数的成本的一个图像,ROC曲线(横坐标是假正率,纵坐标是Recall)。AUC曲线面积越大越好。原创 2022-09-03 18:57:32 · 12742 阅读 · 0 评论 -
Sklearn机器学习——样本不平衡问题解决、精确率、召回率、ROC曲线
介绍样本分类不平衡问题的解决办法,以及SVC的六个模型评价指标,ROC曲线。原创 2022-09-01 23:36:45 · 5641 阅读 · 0 评论 -
机器学习Sklearn——核函数参数的选取、硬间隔和软间隔、重要参数C
介绍四个核函数的参数如何选取,运用学习曲线和网格搜索进行调参。介绍了硬间隔和软间隔的概念,并在数据不完全线性可分,介绍了松弛变量里面的惩罚系数C。在乳腺癌数据案例中找到rbf最适合的两个参数...原创 2022-08-31 19:38:04 · 2116 阅读 · 0 评论 -
机器学习Sklearn——核函数、核函数在不同数据集上的表现、核函数的优势和缺点
介绍核函数的不同类型、核函数在不同数据集上的表现,在rbf上表现最好。以及核函数的缺点,提醒我们需要将数据进行统一量纲处理。原创 2022-08-29 22:06:45 · 3957 阅读 · 1 评论 -
机器学习Sklearn——SVM支持向量机(基础理论、决策过程可视化)
手撕SVM损失函数的求解,有拉格朗日乘子法、对偶问题、KKT条件,将使用SVM进行决策过程可视化从线性的推广到非线性的3D图中。原创 2022-08-25 20:01:44 · 3211 阅读 · 0 评论 -
机器学习Sklearn——红酒分类案例详解决策树模型参数
比较细节得讲了决策树的六个参数,一个重要参数,两个随机参数和三个剪枝参数,以及决策树如何让将这个图片导出来。原创 2022-08-24 17:33:41 · 5012 阅读 · 0 评论 -
机器学习基础——模型的加载和保持、逻辑回归
介绍了逻辑回归这个解决二分类模型的判别模型,用癌症分类问题进行了案例分析,温习了估计其流程以及召回率。并最后阐明了模型的优缺点以及与朴素贝叶斯这个生成模型的区别。原创 2022-08-19 21:43:32 · 707 阅读 · 0 评论 -
机器学习基础——线性回归、过拟合和欠拟合、岭回归和Lasso回归
介绍了非监督学习里面的回归算法的定义,并用波士顿房价的例子进行线性回归,将两种解法(梯度下降法和正规方程法)进行对比,运用均方误差和进行模型评估。还介绍了过拟合和欠拟合以及他们的解决办法(岭回归和Lasso回归)。.........原创 2022-08-17 21:29:07 · 1810 阅读 · 1 评论 -
机器学习基础——数据集的划分、转换器和估计器
在sklearn包里面学会一些数据集(鸢尾花、糖尿病、伦敦房价)以及如何split这些数据集为train data和test data ;介绍了处理数据的transformer和算法的接口以及非监督学习的步骤,为后续做回归以及分类打基础......原创 2022-08-11 20:55:16 · 375 阅读 · 0 评论 -
机器学习基础——分类算法之朴素贝叶斯算法(Bayes)、分类模型评估、选择和调优
介绍了运用贝叶斯算法进行分类,他 的基本概念、进行文本分类案例,进行优缺点的评估。以及分类模型地方调参技巧(网格搜索)以及交叉验证,并在实例中进行检验原创 2022-08-13 22:19:43 · 3135 阅读 · 0 评论 -
机器学习基础——分类算法之决策树、随机森林、Titanic乘客生存分类
对于决策树和随机森林两个模块进行介绍,用kaggle里面的泰坦尼克号数据集预测生存分类进而巩固算法。随机森林对于相同的数据集进行运算准确率更高,普适性更强。原创 2022-08-16 15:52:46 · 905 阅读 · 0 评论