机器学习算法基础2-j机器学习算法分类以及开发流程

最新推荐文章于 2024-01-10 20:50:31 发布

qq_42749341

最新推荐文章于 2024-01-10 20:50:31 发布

阅读量195

点赞数

分类专栏：机器学习-基础知识

本文链接：https://blog.csdn.net/qq_42749341/article/details/107831462

版权

机器学习-基础知识专栏收录该内容

36 篇文章 1 订阅

订阅专栏

注意

1.算法是核心，数据和计算是基础
2.找准定位，大部分复杂模型的算法设计都是算法工程师在做，而我们

分析很多的数据
分析具体的业务
应用常见的算法
特征工程、调参数、优化

3.我们应该怎么做

学会分析问题，使用机器学习算法的目的，想要算法完成何种任务
掌握算法基本思想，学会对问题用相应的算法解决
学会利用库或者框架解决问题

1.机器学习开发流程

在这里插入图片描述

数据：
1、公司本身就有的数据
2、合作过来的数据
3、购买的数据
建立模型：根据数据类型划分应用种类
1、原始数据明确问题做什么
2、数据的基本处理：pd去处理数据（缺失值、合并表）
3、特征工程（特征进行处理）重要
4、找到合适算法去进行预测
5、模型的评估，判定效果

如果没有合格：
换算法参数
特征工程
6、上线使用，以API形式提供

2.机器学习模型是什么

在这里插入图片描述

3.机器学习算法判别依据

数据的类型将是机器学习模型不同问题不同处理的依据

数据类型
离散型数据：由记录不同类别个体的数目所得到的数据，又称计数数据，所有这些数据全部都是整数，而且不能再细分，也不能进一步提高他们的精确度。
连续型数据：变量可以在某个范围内取任一数，即变量的取值可以是连续的，如，长度、时间、质量值等，这类整数通常是非整数，含有小数部分。
注：只要记住一点，离散型是区间内不可分，连续型是区间内可分

4.机器学习算法分类

监督学习：特征值+目标值
非监督学习：特征值

1）监督学习

概念：（英语：Supervised learning），可以由输入数据中学到或建立一个模型，并依此模式推测新的结果。输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值称为回归），或是输出是有限个离散值（称作分类）。
在这里插入图片描述
监督学习-有特征值与目标值

分类—k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络**（目标值离散型）**
回归—线性回归、岭回归**（目标值连续型）**
标注—隐马尔可夫模型 (不做要求)

无监督学习

聚类—k-means

分类问题

概念：分类是监督学习的一个核心问题，在监督学习中，当输出变量取有限个离散值时，预测问题变成为分类问题。最基础的便是二分类问题，即判断是非，从两个类别中选择一个作为预测结果；
在这里插入图片描述
分类问题应用：
分类在于根据其特性将数据“分门别类”，所以在许多领域都有广泛的应用

•在银行业务中，构建一个客户分类模型，按客户按照贷款风险的大小进行分类
•图像处理中，分类可以用来检测图像中是否有人脸出现，动物类别等
•手写识别中，分类可以用于识别手写的数字
•文本分类，这里的文本可以是新闻报道、网页、电子邮件、学术论文

回归问题

概念：回归是监督学习的另一个重要问题。回归用于预测输入变量和输出变量之间的关系，输出是连续型的值。
在这里插入图片描述
回归问题的应用
回归在多领域也有广泛的应用
•房价预测，根据某地历史房价数据，进行一个预测
•金融信息，每日股票走向

2）无监督学习

概念：英语：Supervised learning），可以由输入数据中学到或建立一个模型，并依此模式推测新的结果。输入数据是由输入特征值所组成.
在这里插入图片描述

qq_42749341

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法基础2-j机器学习算法分类以及开发流程

目录注意1.机器学习开发流程2.机器学习模型是什么3.机器学习算法判别依据4.机器学习算法分类1）监督学习分类问题回归问题2）无监督学习注意1.算法是核心，数据和计算是基础2.找准定位，大部分复杂模型的算法设计都是算法工程师在做，而我们分析很多的数据分析具体的业务应用常见的算法特征工程、调参数、优化3.我们应该怎么做学会分析问题，使用机器学习算法的目的，想要算法完成何种任务掌握算法基本思想，学会对问题用相应的算法解决学会利用库或者框架解决问题1.机器学习开发流程数据：1
复制链接

扫一扫

专栏目录