Datawhale X 李宏毅苹果书 AI夏令营Day01

最新推荐文章于 2024-09-30 14:16:32 发布

xuanEpiphany29

最新推荐文章于 2024-09-30 14:16:32 发布

阅读量831

点赞数 18

文章标签：人工智能

本文链接：https://blog.csdn.net/xuanEpiphany29/article/details/141468727

版权

一、打卡

Datawhale

二、学习

李宏毅老师对应视频课程：预测本频道观看人数（上） - 机器学习基本概念简介_哔哩哔哩_bilibili

1、机器学习

(1)、机器学习基础

机器学习是一种人工智能的分支领域，关注如何使计算机系统能够通过数据和经验来学习和改进性能，而无需明确地进行编程。通过机器学习，计算机系统能够从数据中提取模式、进行归纳推理和决策，从而实现自主学习和自主适应。机器学习算法包括监督学习、无监督学习和强化学习等，可以应用于数据挖掘、模式识别、自然语言处理、图像识别等各种领域。

举个例子：

比如现在要计算机通过某种函数给我输出“how are you”的字样，计算机是通过不同的函数来输出不同的结果，而这个函数非常复杂远远不是人类能写出来的，让计算机去寻找这个函数的过程就叫做机器学习

随着要找的函数不同学习方式也不同，分为以下两种：

(1)、Regression (回归):The function outputs a scalar

回归任务的目的是预测一个连续的数值输出。这意味着模型的输出是一个数值（标量），可以用来描述量度或数值相关的事物。

比如我要预测24号空气的PM2.5的值，输出是一个数值。

(2)、Classification(分类)

分类任务的目标是将输入数据分到预定义的类别中。输出是离散的，即模型的结果是固定类别或标签之一。

在邮箱中判断哪一封是垃圾邮件，判断时有两种结果“是”或者“否”。

(2)、查找函数

机器学习查找函数分为三步：

写一个带有未知参数的函数，例如：y=wx+b
定义Loss（Loss本质上也是个function），输入值时L(b,w)，最终的Loss：L= $\frac{1}{N}\sum_{}^{}Ln$
最佳化

import numpy as np  

def loss_function(y_true, y_pred, **kwargs):  
    """  
    计算均方误差（MSE）损失.  
    
    参数:  
    y_true -- 真实值（numpy数组）  
    y_pred -- 预测值（numpy数组）  
    kwargs -- 其他可选参数  
    
    返回:  
    loss -- 计算得到的损失值  
    """  
    # 计算均方误差  
    loss = np.mean((y_true - y_pred) ** 2)  
    
    # 可根据kwargs做额外的处理  
    # 例如，可以通过kwargs调整损失计算的权重  
    if 'weight' in kwargs:  
        weight = kwargs['weight']  
        loss *= weight  

    return loss  

# 示例使用  
y_true = np.array([3, -0.5, 2, 7])  
y_pred = np.array([2.5, 0.0, 2, 8])  

# 调用损失函数  
mse_loss = loss_function(y_true, y_pred)  
print(f"Mean Squared Error Loss: {mse_loss}")  

# 使用权重参数  
weighted_loss = loss_function(y_true, y_pred, weight=0.5)  
print(f"Weighted Mean Squared Error Loss: {weighted_loss}")

函数解释：

参数:
- y_true: 真实的目标值，通常是一个 NumPy 数组。
- y_pred: 模型的预测值，也通常是一个 NumPy 数组。
- kwargs: 其他可选参数，这里可以包含任何额外的参数，如权重等。
损失的计算:
- 该示例损失函数实现了均方误差（MSE）。它计算预测值与真实值之间的平方差，然后取平均值。
- 额外的option参数可以根据需要使用，比如对损失应用一个权重。
返回值:
返回计算得到的损失值。