机器学习-day01

乄卝⑦

于 2024-10-09 22:07:59 发布

阅读量613

点赞数 7

分类专栏：机器学习文章标签：机器学习人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_66162442/article/details/142797666

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、机器学习简介

机器学习形式主要分为：监督学习（Supervise Learning）和无监督学习（Unsupervise Learning）。（半监督学习、强化学习）
从定义上来说，机器学习是一种功能、方法，或者更具体的说是一种算法，它能够赋予机器进行学习的能力，从而使机器完成一些通过编程无法直接实现的功能。
从具体的实践意义来说，其实机器学习是利用大量数据训练出一个最优模型，然后再利用此模型预测出其他数据的一种方法。比如要识别猫、狗照片就要拿它们各自的照片提炼出相应的特征（比如耳朵、脸型、鼻子等），从而训练出一个具有预测能力的模型。
机器学习与人工智能、深度学习的关系：

监督学习：事先需要准备好要输入数据（训练样本）与真实的输出结果（参考答案)，然后通过计算机的学习得到一个预测模型，再用已知的模型去预测未知的样本。
无监督学习：在没有“参考答案”的前提下，计算机仅根据样本的特征或相关性，就能实现从样本数据中训练出相应的预测模型。
预测结果分类
根据预测结果的类型，对上述学习形式做具体的问题划分。

有监督学习划分为：
①回归（Regression）问题（预测数据，预测结果是连续的且可能无限多，比如身高，从 1.2m 到 1.78m 这个长高的过程就是连续的、预测房价）
②分类（Classification）问题（预测分类，预测结果是离散的且有限个、肿瘤是良性还是恶性）
无监督学习划分为：
聚类问题（将相似的样本聚合在一起后，然后进行分析，网站文章分组）

二、线性回归模型（Linear Regression Model）

房价模型：给定一些数据，包括房屋面积和房价（input和output），通过建立模型来预测未知面积房屋的价格。
常用术语

（1）模型：把它看做一个“魔法盒”，你向它许愿（输入数据），它就会帮你实现愿望（输出预测结果）
（2）数据集：如果说“模型”是“魔法盒”的话，那么数据集就是负责给它充能的“能量电池”。数据集可划分为“训练集”和**“测试集**”。

（3）样本&特征：“一行一样本，一列一特征” 数据集中的数据，一条数据被称为“一个样本”；样本会包含多个特征值用来描述数据。

（4）向量：在线性代数中，向量也称欧几里得向量、几何向量、矢量，指具有大小和方向的量。在机器学习中，模型算法的运算均基于线性代数运算法则，比如行列式、矩阵运算、线性方程等等。向量的计算可采用 NmuPy 来实现
（5）矩阵：可以把矩阵看成由向量组成的二维数组，数据集就是以二维矩阵的形式存储数据的。
线性回归模型（表达式）
几个函数的概念：

损失函数（Loss Function ）是定义在单个样本上的，算的是一个样本的误差。

代价函数（Cost Function ）是定义在整个训练集上的，是所有样本误差的平均，也就是损失函数的平均。

目标函数（Object Function）定义为：最终需要优化的函数。等于经验风险+结构风险（也就是Cost Function + 正则化项）。

代价函数：是在机器学习和优化问题中用于衡量模型预测结果与真实值之间的差异的函数。代价函数的目标是最小化模型的预测误差或损失。

平方误差代价函数：(m为样本总数)
$J(w,b)=\frac{1}{2m}\sum_{i=1}^{m}(f_{(w,b)}(x^{(i)})-y^{(i)})^2$

我们的目标是要使代价函数最小化：
$minimi ze J (w, b)$
当b=0是，选取不同的w时的代价函数**J(w)**如图所示。

当有两个参数w和b时，**J(w,b)**图像如图所示

在这里插入图片描述
实验证明：**J(w,b)**的值越接近最底部椭圆（登高线），拟合的效果越好。

关注

7
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

乄卝⑦ CSDN认证博客专家 CSDN认证企业博客

码龄3年

20: 原创

133万+: 周排名

20万+: 总排名

5050: 访问

: 等级

268: 积分

42: 粉丝

67: 获赞

11: 评论

33: 收藏

私信

关注

热门文章

分类专栏

机器学习 1篇

最新评论

蓝桥杯入门刷题训练——枚举、模拟
CSDN-Ada助手: 恭喜你写了第18篇博客，标题看起来非常有趣呢！对于蓝桥杯入门刷题训练的内容，你的解说应该会对很多初学者有所帮助。不过，我觉得你可以考虑在下一篇博客里增加一些实例或者案例分析，这样可以更具体地帮助读者理解枚举和模拟的相关知识。希望你能继续保持创作，加油！
牛客小白月赛81（A~D）
2301_80359550: 小辰的圣剑为什么用一个循环搭配if语句会显示半对呀一定要两个循环吗
牛客小白月赛81（A~D）
CSDN-Ada助手: 恭喜博主在牛客小白月赛中的出色表现！看到你已经写了第16篇博客，真是令人钦佩。你对比赛题目的解析和思路分析都非常出色，给读者们提供了很多有价值的参考。我希望你能继续保持这种创作的热情和努力，不断提升自己的写作水平。作为下一步的创作建议，我建议你可以尝试更多不同类型的题目，挑战一些更复杂的难题。通过解析这些题目，你可以进一步提升自己的算法思维和编程技巧，让你的博客内容更加全面和有深度。同时，你也可以考虑添加一些实例和案例分析，以加强读者对题目解决方法的理解和应用能力。总的来说，你已经取得了很大的进步，但请记住保持谦虚和学习的心态，因为学无止境。期待看到你未来更多优秀的博文，继续为大家带来更多的灵感和启发！
树状数组练习Day02
CSDN-Ada助手: 恭喜你写了第14篇博客！看来你对树状数组的练习很有毅力呢。不过接下来，我建议你可以考虑分享一些实际应用场景下的树状数组解决方案，或者结合其他数据结构进行深入探讨。希望你能继续保持创作的热情，加油！
算法学习记录--树状数组Day01
CSDN-Ada助手: 非常祝贺您写了第13篇博客，题为“算法学习记录--树状数组”。您的持续创作精神值得赞赏！在您的博客中，您详细介绍了树状数组的学习过程，这对于其他学习者来说是非常有用的。我希望您能够继续保持写作的热情和耐心，与读者分享更多有关算法学习的经验和知识。对于下一步的创作建议，我认为您可以考虑探索一些与树状数组相关的实际应用场景，这将有助于读者更好地理解和应用这一算法。再次恭喜您，期待您未来更多精彩的创作！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。