机器学习基础——数据类型与开发流程

一.机器学习基础

1.机器学习的算法分类
2.机器学习的开发流程

学习前明确以下几点:
(1)机器学习最终进行预测出来的结果其实都是通过相关的算法,算出来的结果。所以在机器学习中,算法是核心,数据是计算的基础。
大部分的复杂模型的算法设计都是由算法工程师在做而我们本科生只需要:
(1)我们只需要会分析问题,使用机器学习相关算法完全对应的需求
(2)掌握算法的基本思想,学会对不同问题选择对应的算法去解决。
(3)学会利用框架和库解决问题。

二.机器学习中的数据类型

机器学习中的数据类型分为:
离散型数据:
离散变量则是通过计数方式取得的,即是对所要统计的对象进行计数,增长量非固定的,如:一个地区的企业数目
可以是今年只有一家,而第二年开了十家;一个企业的职工人数今年只有10人,第二年一次招聘了20人等。
连续型数据:
连续变量是一直叠加上去的,增长量可以划分为固定的单位,即: 1,2,3……例如:一个人的身高,他首先长到
1.51,然后才能长到1.52,1.53…o
注意:连续型数据是有规律的,离散型数据是没有规律的。

三.机器学习的算法分类

1.分类和回归

分类算法是基于【标签数据】为【离散型】的数据
回归算法是基于【标签数据】为【连续型】的数据
结论∶在社会中产生的数据必然是离散型或者是连续型的数据,那么企业针对数据所产生的需求也无非是分类问题或者
回归问题。

2.分类问题的应用

预测明天是晴天:分类
人脸识别:分类
预测电影的票房:回归

四.机器学习的开发流程

机器学习开发流程.
1.数据采集
公司内部产生的数据
和其他公司合作获取的数据
购买的数据
⒉.分析数据所对应要解决需求或者问题是什么?根据目标数据推断问题属于回归还是分类!
3.数据的基本处理
数据清洗
合并
级联等
4.特征工程:对特征进行处理
特征抽取
特征预处理
降维等
5.选择合适的模型,然后对其进行训练
6.模型的评估
7.上线使用

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值