机器学习第一篇：线性回归算法

最新推荐文章于 2024-03-20 10:42:40 发布

leo_dragon

最新推荐文章于 2024-03-20 10:42:40 发布

阅读量438

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/leo_dragon/article/details/88901768

版权

本文介绍了机器学习的基础概念，包括应用场景、机器学习流程、数据源结构和算法分类。重点讨论了过拟合问题及其解决方案——正则化，包括L1和L2正则化的理解与作用。最后，讲解了Sklearn库在机器学习中的应用，涉及数据预处理、模型训练和评估。

摘要由CSDN通过智能技术生成

机器学习第一篇：线性回归算法
1、机器学习主要应用场景
2、机器学习基本概念
3、算法分类
4、过拟合问题
5、Sklearn常用包分析

机器学习主要应用场景

聚类场景：人群划分和产品种类划分
分类场景：广告投放预测和网站用户点击预测
回归场景：降雨量预测、产品购买量预测和股票成交额预测
文本分析场景：新闻的标签提取，文本自动分类和文本关键信息抽取
关系图像法：社交网络关系（SNS）网络关系挖掘和金融风险控制
模式识别：语音识别、图像识别和手写识别

机器学习基本概念

机器学习的过程是一个数据流转、分析以及得到结果的过程。机器学习的整个学习流程大致分为6个步骤：场景解析、数据预处理、特征工程、模型训练、模型评估、离线/在线服务

标题机器学习流程

1.场景解析，就是把整个业务逻辑想清楚，把自己的业务场景进行一个抽象，总的来说，场景抽象就是把业务逻辑和算法进行匹配；
2. 数据预处理，主要是进行数据的清洗工作，针对数据矩阵中的空值和乱码进行处理，同时也可以对整体数据进行拆分和采样等操作，也可以对单字段或者多字段进行归一化或者标准化的处理。数据预处理主要是为了减少量纲和噪音数据对于训练数据集的影响。
3. 特征工程：特征工程是机器学习最重要的一部分，在算法相对固定的情况下，可以说好特征决定了好结果。
4. 模型训练：训练数据经过数据预处理和特征工程之后进入算法训练模块，并且生成模型。在预测组件中，读取模型和预测集数据进行计