机器学习
文章平均质量分 80
兰泽S
这个作者很懒,什么都没留下…
展开
-
Python——机器学习多分类问题实例:缺陷检测分类问题
本文介绍多分类问题的建模方法,重点在于说明多分类问题与二分类问题的区别。(2)对分不准的类别的分析和特殊处理方法。(3)多分类标签的稀疏化处理。先占个位置,防止犯懒不想写~(1)数据不平衡问题。原创 2024-04-21 22:30:54 · 116 阅读 · 0 评论 -
Python——一文详解使用yolov5进行目标检测全流程(无需gpu)
本文按步骤详细介绍了使用yolov5进行目标检测的全流程,包括:模型下载、环境配置、数据集准备和数据预处理、模型调整、模型训练、进行目标检测和检测结果分析。本文全部流程使用cpu完成(无需gpu),旨在跑通流程,模型训练过程较慢,且未能到达最优结果。需要 python版本>=3.8。原创 2024-03-03 16:21:51 · 4336 阅读 · 2 评论 -
Python——机器学习:不平衡数据集常用处理方法和实例
本文梳理了几种常用的不平衡数据集处理方法,包括过采样、欠采样,类别加权和数据加权的方法。以下通过信用卡违约实例数据进行说明。不平衡数据集,尤其长尾数据一直都是重点和难点。实际应用中,应根据具体的业务需求,确定应该尽量提高模型的哪个指标。如:对于信用卡违约这样一个对正类样本(违约)判定要求较高的场景,往往需要更高的召回率。我们采用AUC和F1得分评价模型结果,总体情况见下表。可见效果都一般,但处理后,F1值确实都有提升。(注:本文中除基模型外的模型均未进行调优,可能对处理后的数据未必合适。原创 2024-02-05 18:22:35 · 1543 阅读 · 1 评论 -
Python——机器学习分类模型实例:进阶模型融合Voting和Stacking详解
本文利用预处理后的数据集,介绍模型融合的 Statcking 和 Voting方法的原理和使用,用以提高模型预测的准确率。Stacking 方法扒了一下sklearn中的源码,其处理方法似乎和大部分原理类文章中讲的不太一样。原创 2024-01-24 20:00:00 · 1066 阅读 · 1 评论 -
Python——机器学习分类模型实例:从数据预处理到模型训练全流程
本文旨在通过一份具体的数据,演示机器学习分类任务从数据预处理到模型训练的全流程。数据预处理过程主要包括缺失值、离群值处理,哑变量化和标准化。模型训练采用随机森林模型和LightGBM模型,同时进行了重要性变量提取和参数调优。文中也对一些细节和进阶的数据处理方法,进行了相应的文字提示。原创 2024-01-17 09:10:26 · 1552 阅读 · 2 评论 -
python——机器学习:sklearn模型选择model_selection模块函数说明和应用示例
本篇文章通过具体数据做示例,总结了sklearn中模型选择model_selection模块常用函数的说明和使用方法。包括:1. 数据切分:train_test_split;2. K折交叉验证:KFold,StratifiedKFold,cross_val_score;3. 参数网格搜索GridSearchCV原创 2024-01-09 23:23:11 · 2207 阅读 · 1 评论 -
python——机器学习:sklearn特征选择feature_selection
特征选择是机器学习中很重要的一部分,构造并选取合适的特征,能极大的提高模型的表现。sklearn中feature_selection模块提供了一些特征选择方法。包括方差阈值法、相关性过滤法、嵌入法和包装法等。本文通过鸢尾花数据集详细介绍这些方法的使用原创 2023-08-22 16:19:02 · 1617 阅读 · 3 评论 -
python——机器学习:sklearn数据预处理preprocessing连续特征离散化和类别特征编码
本篇整理通过sklearn的preprocessing模块,进行连续特征离散化和离散特征编码的方法。为数据预处理的一部分。原创 2023-07-11 10:09:35 · 491 阅读 · 3 评论 -
python——机器学习:sklearn数据预处理preprocessing标准化、归一化和纠偏
前段时间参加了一个数据建模比赛,机器学习部分主要是应用python的sklearn库,现整理一下自己当时的复习内容。整个数据建模的第一部分也是最主要的部分是数据预处理。其常规顺序(不一定全需要做)为:处理离群值、处理缺失值、标准化或归一化、纠偏、连续特征离散化、类别特征编码、特征增强和对不平衡数据集的处理(仅针对分类问题)。本篇是数据预处理中的数据标准化或归一化和纠偏部分。原创 2023-05-31 23:33:06 · 2675 阅读 · 1 评论