机器学习一集成学习

最新推荐文章于 2023-05-22 15:29:58 发布

置顶

phyllisyuell

最新推荐文章于 2023-05-22 15:29:58 发布

阅读量1.5k

点赞数 1

分类专栏：大数据，机器学习文章标签：机器学习 python 决策树集成学习 xgboost

本文链接：https://blog.csdn.net/phyllisyuell/article/details/79183781

版权

本文介绍了机器学习的基本概念，引用了Tom Mitchell的定义，强调了任务、经验和性能的重要性。接着，文章简述了Python在数据分析中的角色，提到了numpy, pandas, scikit-learn等库。然后，重点讨论了分类问题，特别是二分类，并以决策树为例，解释了决策树的工作原理。最后，文章介绍了集成学习，包括Boosting、Bagging、随机森林和GBDT，并提到了Xgboost作为优化的boosting工具。集成学习是提升模型性能的关键，广泛应用于各个领域。" 132522023,7337247,模拟退火算法在多目标优化中的应用,"['人工智能', '优化算法', '编程实践', '多目标模拟退火', '模拟退火算法']

摘要由CSDN通过智能技术生成

一、何为机器学习？

机器学习最近那么火，博主自学习以来，也看过不少有关机器学习的资料，首先对于机器学习的定义就又五花八门，什么让机器像人一样去学习，说的总感觉有些浮夸而不现实，把机器学习搞的也太神秘了，有幸看了吴恩达的课程，最喜欢课程里吴恩达引用的卡内基梅隆大学，Tom Michael Mitchell 1997年对机器学习下的定义:

A computer program is said to learn from experience E with respect to some task T and some performance measure P,if its performance on T,as measured by P,improves with experience E.

简单来讲就是：

对于某给定的任务T，在合理的性能度量方案P的前提下，某计算程序可以自主学习任务T的经验E；随着提供合适，优质，大量的经验E，该程序对于任务T的性能逐步提高。

我觉得这个思想也一直贯穿着机器学习的方方面面。

这里最重要的机器学习的对象：

任务Task,T, 一个或者多个

经验Experience,E

性能Performance，P

即：随着任务的不断执行，经验的积累会带来计算性能的提升。

二、Python概述

这里简单介绍下python语言，相信研究机器学习的人里，用python的人还是比较多的。

python数据分析大家族

1）numpy数据结构基础