机器学习第一篇:线性回归算法

本文介绍了机器学习的基础概念,包括应用场景、机器学习流程、数据源结构和算法分类。重点讨论了过拟合问题及其解决方案——正则化,包括L1和L2正则化的理解与作用。最后,讲解了Sklearn库在机器学习中的应用,涉及数据预处理、模型训练和评估。
摘要由CSDN通过智能技术生成

机器学习第一篇:线性回归算法
1、机器学习主要应用场景
2、机器学习基本概念
3、算法分类
4、过拟合问题
5、Sklearn常用包分析

机器学习主要应用场景

聚类场景:人群划分和产品种类划分
分类场景:广告投放预测和网站用户点击预测
回归场景:降雨量预测、产品购买量预测和股票成交额预测
文本分析场景:新闻的标签提取,文本自动分类和文本关键信息抽取
关系图像法:社交网络关系(SNS)网络关系挖掘和金融风险控制
模式识别:语音识别、图像识别和手写识别

机器学习基本概念

机器学习的过程是一个数据流转、分析以及得到结果的过程。机器学习的整个学习流程大致分为6个步骤:场景解析、数据预处理、特征工程、模型训练、模型评估、离线/在线服务

标题机器学习流程

1.场景解析,就是把整个业务逻辑想清楚,把自己的业务场景进行一个抽象,总的来说,场景抽象就是把业务逻辑和算法进行匹配;
2. 数据预处理,主要是进行数据的清洗工作,针对数据矩阵中的空值和乱码进行处理,同时也可以对整体数据进行拆分和采样等操作,也 可以对单字段或者多字段进行归一化或者标准化的处理。数据预处理主要是为了减少量纲和噪音数据对于训练数据集的影响。
3. 特征工程:特征工程是机器学习最重要的一部分,在算法相对固定的情况下,可以说好特征决定了好结果。
4. 模型训练:训练数据经过数据预处理和特征工程之后进入算法训练模块,并且生成模型。在预测组件中,读取模型和预测集数据进行计

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值