机器学习成长之路——基础知识

本篇主要介绍什么是机器学习,机器学习的基本概念,以及机器学习应用程序的步骤。

一、什么是机器学习

机器学习的概念

首先我们聊一下什么是机器学习,顾名思义,简单直白的来说就是字面上的意思,让机器去学习;但是机器是没有思维的,如何让机器能够类似人一样去学习和思考问题呢?当前有很多科学家在致力于人工智能机器人上面,通过各种传感器让机器人来模拟人的思维方式和类人操作行为;在这里就需要一套有逻辑性的思维算法来支撑机器模拟人的各种行为,从而做出人类满意的操作行为。这里的算法是一种逻辑思想,需要我们使用代码进行实现。机器学习的范围很广,小到垃圾邮件过滤,大到人工智能机器人都会涉及。同时机器学习实际的知识面也是相当广泛,横跨计算机科学、工程技术和统计学等多个学科,需要多科学的专业知识。

机器学习的重要性

在过去的半个多世纪,跟多发达国家的多数岗位已经由体力劳动转为脑力劳动。过去的工作基本上都有明确的定义,例如把货物装上车,把货物上架和下架。目前这些工作在逐步消失,例如天猫、京东等电商在逐步替代实体店铺,人工机器人分拣货物在逐步替代人工劳动。现如今的情况还具有很大的二义性,类似于“最大利益化”、“最小风险化”、“找到最好的市场策略”等,虽然可以在互联网上找到相关的信息,但这并没有简化知识工人的工作量。针对具体的任务搞懂所有相关数据的意思所在,这正成为基本的技能要求。

海量的经济活动都依赖于信息,我们不能在海量的数据中迷失,机器学习将有助于我们穿越数据雾霭,从中抽取有价值的数据。

二、机器学习的基本概念 

 在开始学习机器学习之前,必须掌握一些机器学习的相关术语。

特征:是指某一事物或者种类具有的相同的基本信息,例如:鸟类都有翅膀,灯泡都会发光等。

目标变量:又称为类别,是机器学习算法的预测结果。在分类算法中目标变量的类型通常是标称变量型的,而在回归算法中通常是连续型。

训练样本集:是用于训练机器学习算法的数据样本集合,训练样本集必须确定目标变量的值,以便于机器学习算法可以发现特征和目标变量之间的关系。

测试样本:用于测试测算的精度的训练样本

算法训练:学习如何进行分类,依据训练样本对选择的算法进行数据训练,使用测试样本检测算法的精度的一个过程称为算法训练。

三、机器学习应用步骤

(1)收集数据

(2)准备输入数据

(3)分析输入数据

(4)训练算法

(5)测试算法

(6)使用算法

四、开发语言选择

 目前我使用python语言进行相关的机器学习,原因:

(1)python语法清晰

(2)易于操作纯文本文件

(3)使用广泛,存在大量的开发文件

(4)算法库比较丰富,便于开发

五、总结

机器学习首先要先理解常用的九大算法的使用场景,在今后项目开发过程中这些算法远远不能满足我们的业务需求。我们可以借鉴相关的设计思路,然后在相关算法基础来优化和编写自己的算法库,从而满足项目应用的开发需求。今天就这样,下一章节要直接进入主题,介绍“K-近邻算法” 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值