一、监督学习
监督学习分为回归问题regression和分类问题classification
input(x)---------------->output(y) 其中y正确答案的标签
例如:回归问题----------房价预测(无限个数字中预测一个数字)
分类问题------------判断是否是乳腺癌(两个输出)
二、无监督学习
无监督学习-------------------没有提供示例的正确答案的标签。
无监督学习算法有聚类(clustering)、异常检测(anomaly detection)、降维(Dimensionality reduction)
聚类算法:获取没有标签的数据并尝试自动将它们分组到集群。
异常检测:用于检测异常事件
降维:将大数据集压缩成小的多数据集,尽可能少的丢失信息
例如:DNA基因-每个人的喜欢西兰花的基因--聚类
细分市场——聚类
新闻分类——聚类
三、jupyter Notebook
运行机器学习的代码,熟悉python使用。