什么是机器学习
机器学习和现在火热的深度学习有点区别,机器学习包含深度学习,机器学习在人工智能范围里。人工智能、机器学习、深度学习关系:
人工智能>>机器学习>>深度学习
机器学习是很多算法的统称,不单指某种算法。
通过训练集,不断识别特征,不断建模,最后形成有效的模型,这个过程叫"机器学习"
- 从大的范围理解机器学习就是将现实问题抽象为数学问题,机器解决数学问题从而解决现实问题。
- 传统的软件是人为地设定条件,告诉计算机符合这个条件后应该做什么(if A then B)
- 机器学习或者深度学习是从大量的数据中总结规律,归纳出知识,并将知识用用到现实场景当中
- 现阶段的人工智能只能解决特定的问题,是单一任务解决模式。像科幻电影里的机器人既能感知人类的情绪又能做家务的"无所不能"机器人,目前还没有达到这个阶段。
机器学习的过程
- 监督学习(用打上标签的数据训练)
- 非监督学习(用不打标签的数据训练)
- 强化学习
实操步骤:
收集数据——数据准备——选择模型——训练——评估——参数调整——预估
收集数据
数据的数量、给数据加上标签等。
数据准备
拟合就是通过模型训练数据学习到了数据的特征
选择模型
一般选择模型这一步都是直接挑选现成的模型
训练
机器独立完成,不需要人参与。所以整个过程最重要的是数据的收集和数据准备,他们决定了模型的质量
评估
模型的准确率、召回率、F值
监督学习
监督学习有两个重要的任务:
- 回归:预测连续的、具体的值
- 分类:对各种事务分门别类,用于离散预测
监督学习的算法
- 分类算法:朴素贝叶斯、决策树、SVM、逻辑回归
- 回归算法:线性回归、回归线
- 分类+回归:K邻近、Adabosting、神经网络
无监督学习
- 场景:用于发现异常数据、用户细分、推荐系统
- 通过无监督学习可以把行为进行分类,虽然我们并不知道这些分类意味什么,但通过分类可以快速排出非正常用户,对异常行为进行深入分析。
无监督学习算法
- 聚类:K均值聚类、层次聚类
- 降维:主成分分析PCG、奇异值分解SVD
学习总结
机器学习最根本还是数学问题。。。