第一章《绪论》

小刘就是我

已于 2023-05-02 09:51:51 修改

阅读量37

点赞数

分类专栏：机器学习文章标签：人工智能数据挖掘机器学习

于 2023-05-01 11:11:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74381517/article/details/130454452

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

一、什么是机器学习？

人类的学习：经验+不断提高技能

机器的学习：数据+不断提高“技能”（此处的技能可以是：计算机系统、程序、算法等）

机器学习的定义：假设用P来评估计算机程序在某任务T上的性能，若一个程序通过利用经验E在T任务上获得性能提升，则我们就说关于T和P，该程序对E进行了学习。

机器学习还有其他的一些通俗定义，但总的来说就是计算机+经验+改善性能，从而产生“模型”用于对新的数据进行判断。

二、基本概念

训练集：用于机器学习的输入，获取“经验”

学习算法：不同的场景会用到不同的学习算法

模型：通过设定好的学习算法和训练集得出的针对某一问题的解决办法

测试集：用于对模型的评估，测试模型解决某一问题的效果

三、应用领域

模式识别、计算机视觉、数据挖掘、语音识别、统计学习、自然语言处理等

四、人工智能、机器学习与深度学习的关系

人工智能：机器展现的人类智能

机器学习：计算机利用以后的数据（经验），得出的某种模型，并预测未来新数据的一种方法

深度学习：实现机器学习的一种技术

五、发展历程

1950-1956：图灵发表《计算机器与智能》，提出并尝试回答“机器能否思考”。达特茅斯会议，首次定义了概念--人工智能

1956-60/70年代：平静期

70-80年代：推理期

80-90年代：知识期

90-2006年：学习期

直到现在：蓬勃发展期

六、发展趋势

鲁棒性：T.Dietterich强调：随着人工智能技术的发展，越来越多地面临高风险应用，因此人工智能必须要有“鲁棒性”（也就是更正错误的鲁棒）。

泛化性：应用于新的样本数据，也能取得较好的效果。（这是难点也是重点）

可解释性：对模型内部机制的理解和模型结果的理解。

发展趋势：小样本学习 and 感知智能->认知智能

七、机器学习的类型

监督学习(有标签Y)：回归、K近邻、SVM、决策树、朴素贝叶斯、逻辑回归、XGBoost、Lightgbm

无监督学习(无标签Y)：聚类、降维算法、EM算法

强化学习(序列决策)：马尔科夫决策方法

八、机器学习的一般步骤

数据搜集：数据集的获取方式有很多

数据清洗：错误数据，重复数据等的清理

特征工程：特征提取，在原始数据中提取并创建新特征；特征选择，留下最重要的特征

数据建模：选择指标最佳的机器学习模型进行参数优化，最后得出最佳结果

九、拟合

欠拟合：对训练集都拟合不好，对测试集自然也不佳

较好拟合：对训练集拟合较好，对测试集也较好

过拟合：对训练集拟合过好，对测试集拟合不好

十、需要掌握的python模块

numpy

pandas

scipy

matplotlib

scikit-learn

小刘就是我

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
第一章《绪论》

机器学习的定义：假设用P来评估计算机程序在某任务T上的性能，若一个程序通过利用经验E在T任务上获得性能提升，则我们就说关于T和P，该程序对E进行了学习。鲁棒性：T.Dietterich强调：随着人工智能技术的发展，越来越多地面临高风险应用，因此人工智能必须要有“鲁棒性”（也就是更正错误的鲁棒）。机器学习：计算机利用以后的数据（经验），得出的某种模型，并预测未来新数据的一种方法。机器的学习：数据+不断提高“技能”（此处的技能可以是：计算机系统、程序、算法等）较好拟合：对训练集拟合较好，对测试集也较好。
复制链接

扫一扫

专栏目录

小刘就是我 CSDN认证博客专家 CSDN认证企业博客

码龄2年

13: 原创

21万+: 周排名

9万+: 总排名

1733: 访问

: 等级

160: 积分

29: 粉丝

30: 获赞

6: 评论

19: 收藏

私信

关注

热门文章

分类专栏

机器学习 5篇
dwi图像自监督去噪

最新评论

第二章《模型评估与选择》part2_性能度量one
CSDN-Ada助手: 恭喜您写完了第5篇博客！看到您持续创作，我感到非常高兴。标题为“第二章《模型评估与选择》part2_性能度量one”的博客内容似乎非常有深度和价值。我希望您能继续保持写作的热情，并继续分享关于模型评估与选择的知识。对于下一步的创作建议，我谨慎地提出一个小小的建议：或许您可以考虑在博客中添加一些实际案例或者具体的应用场景，这样读者更能够将理论与实践相结合，加深对内容的理解。当然，这只是一个建议，希望您能根据自己的兴趣和时间安排进行创作。再次恭喜您，期待您的下一篇博客！
第三章《线性回归》part1
CSDN-Ada助手: 恭喜您完成了第6篇博客，题为“第三章《线性回归》part1”。您的创作持续不断，真是令人佩服！从您的博客标题来看，我想了解更多关于线性回归的知识。如果可能的话，我希望您能在下一篇博客中分享一些实际应用案例或者一些实用的技巧，以便我们更好地理解和应用线性回归。期待您的下一篇博客，谢谢！
第二章《模型评估与选择》part1_性能度量
小刘就是我: 感谢你的支持，如果要探讨具体的实现也不难，只需要在您的模型训练完以后，调用sklearn库里面的指标函数，例如本文提到的就可以了。我最近可能比较忙呢，感谢理解
第二章《模型评估与选择》part1_性能度量
CSDN-Ada助手: 非常感谢用户的持续创作，第二章的性能度量是机器学习领域中的重要一环，能够对模型的性能进行评估和选择。希望在下一篇博客中，能够更深入地探讨性能度量的具体实现和应用场景，让读者能够更好地理解和应用这些指标。期待用户的下一篇博客！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
第一章《绪论》
CSDN-Ada助手: 非常感谢您写下如此详细和易懂的博客！机器学习作为当前最热门的技术之一，一定会受到更多人的关注和关心。除了博客中提到的知识和技能，我想补充一下深度学习的内容，这是机器学习的一个分支，已经在图像识别、自然语言处理等领域有很好的表现。同时，这个领域也在不断地发展和创新，我相信您一定也会对它感兴趣。再次感谢您的分享和努力，期待您更多的创作！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。