day4 简单了解回顾一下机器学习的部分内容 1.机器学习的一些历史和发展 2.几个典型应用 2.1.关联规则 2.2.聚类 2.3.朴素贝叶斯和决策树 2.4.ctr预估和协同过滤 2.5.典型自然语言和图像识别 3.数据分析和机器学习的区别 最大的区别就是数据分析是分析过去的情况,机器学习是预测未来的情况 4.机器学习的常见算法分类 4.1.有监督(所有数据已经被打好标签)(分类和回归)、无监督(训练数据中没有Y只有X)(聚类)、半监督 4.2.分类和回归、聚类、标注(分词) 4.3.生成模型(分成各个类的概率)、判别模型(分为哪个类) 5.机器学习常见算法 5.1.分类:C4.5、KNN、Naive Bayes、CART 5.2.聚类:K-means 5.3.统计学习:SVM、EM 5.4.关联分析:Apriori 5.5.链式挖掘:PageRank 5.6.集装与推进:AdaBoost 6.机器学习解决问题的框架 6.1.确定目标:业务需求、数据、特征工程 6.2.训练模型:定义模型、定义损失函数、优化算法 6.3.模型评估:交叉验证、效果评估