机器学习主要分为两种:1.监督式学习 supervised learning
2.非监督式学习
监督式学习:
我们需要提供一组学习样本。通过对样本数据的学习相关的规律或者模式,然后通过得到的规律或者模式来判断没有被打过标签的数据时什么样的数据。
问题:
1.一个事物没有历史数据。
2.历史数据中可能会有一些是噪音数据
非监督式学习:
监督式学习是在被告诉了正确答案之后的学习,非监督式学习是没有被告知正确答案之后的学习。非监督式学习是在大量非常乱的数据里寻找一些潜在的关系。
机器学习就是在已知的样本数据中寻找数据的规律,在未知的数据中寻找数据的关系。
相关算法:
监督式学习:
1.决策树。(自动化放贷、风控)
2.朴素贝叶斯分类。判断垃圾邮件、对新闻的类别进行分类,判断文本表达的情感是积极的还是消极的、人脸识别等
3.最小二乘法。
4罗辑回归。用于信用评分、计算营销活动的成功率、预测某个产品的收入
5.支持向量机(SVM) 图像检测
6.集成方法
非监督式学习:
1.聚类算法( PCA )压缩、简化数据
2.奇异值分类(SVD)计算机视觉