什么是机器学习?
核心思想就是用机器解决现实生活中的问题。
基本思路大致可以分为三部
1.将现实生活中的问题抽象成数学问题,建立数学模型。
2.利用数学的方法对这个数学问题求解,然后解决生活中的实际问题。
3.评估这个数学模型,是否解决了问题,解决的效果如何。
监督学习,非监督学习,强化学习
1.监督学习:是指我们给模型一个数据集,并给出正确答案。任务是让模型学习数据集与答案时间的对应关系。
2.非监督学习:给定数据集,但是没有给定正确答案。任务是让模型从数据集中找出潜在结构。
3.强化学习:强化学习更接近生物学习的本质。它的任务是模型如何在环境中采取一系列的行为,从而获得更大的累积回报。(经典的阿尔法狗,就是下围棋那个。)
机器学习实际操作的步骤
收集数据
收集数据是非常重要的,因为数据的质量决定的模型的质量,数据相对于模型,就好比食物相对于人。如果一个人吃的食物质量差,那么他懂得再多的健康知识,进行再多的锻炼也是不行的。
数据准备
这一步就像是洗菜,洗食物。
刚拿到手的食物(数据),会存在各种各样的问题。那么我们就需要对摘叶子(去掉残缺的数据,异常的数据)。然后还会切菜(将数据分类整理训练集,验证集,测试集)
选择模型
这一步就像是炒菜选择菜谱(模型),针对食物(数据)、顾客的口味(目的)选择合适的菜谱炒菜(选择合适的模型处理数据)。
训练
很多人,认为这一步是重要的(当然这一步确实很重要),但是台上(训练)三分钟,台下(收集数据,数据准备,选择模型)十年功。必训练过程更加重要。如果不根据食物(数据)、顾客的口味(目的)选择合适的菜谱炒菜,那最终的结果一定不怎么样(想象一下清炒王八好吃么,哈哈哈哈)
评估
一旦炒完菜(训练完成)就要尝菜,评价菜的色香味(准确率,召回率,F值等,这里根据不同的模型有不同的评价标准)
参数调整
根据评价指标,我们就要改进一下炒菜是油盐酱醋的量与比例(训练参数)
预测
我们之前忙活这么一大圈就是要为现在服务的(上菜!!!)
十五中经典的机器学习算法
监督学习
线性回归,逻辑回归,线性判别分析、决策树、朴素贝叶斯、K近邻、学习向量量化、支持向量机、随机森林、AdaBoost。
非监督学习
高斯混合模型、限制波尔兹曼机、K-means聚类、最大期望算法。