入门概念
机器学习核心: 使用算法解析数据,建立模型进行学习,然后对事情进行预测。
机器学习类型: 监督学习,非监督学习,强化学习
- 监督学习:代表为分类与回归。 涉及一组带有标签的数据,将数据划分为特定类。example01:邮件账户过滤器,将邮件分为垃圾邮件与正常邮件。example02:使用标记的数据预测未来的,天气预测。
- 无监督学习:代表为聚类与降维。对没有标签的数据进行降维以及分组。
- 强化学习:使用机器的个人历史经验做决定。没有标签,它是通过环境给出的奖惩来学习。通过不断与环境交互,利用环境给出的奖惩来不断的改进策略(即在什么状态下采取什么动作),以求获得最大的累积奖惩。比如玩五子棋。
回归算法
基于连续变量预测特定结果的监督学习算法,速度快
基于实例算法
KNN比较数据点的距离,并将点分配给它最近的组
决策树算法
弱学习器是随机选择的,通过组合可以获取得一个强预测器。
贝叶斯算法
特征之间相互独立
聚类算法
代表:k-means算法