机器学习、计算机视觉与NLP：从基础到深度学习的综合指南

摘星月为妆。

于 2024-04-03 14:02:47 发布

阅读量1.1k

点赞数 14

分类专栏：机器学习与计算机视觉文章标签：机器学习计算机视觉自然语言处理深度学习神经网络人工智能

本文链接：https://blog.csdn.net/weixin_63740705/article/details/137338804

版权

机器学习与计算机视觉专栏收录该内容

1 篇文章 0 订阅

订阅专栏

I.引言

当前AI技术的重要性和普及性

在当今这个快速发展的数字时代，人工智能（AI）已经成为推动创新和改变我们生活方式的关键技术。AI的重要性不仅体现在它能够处理大量数据、识别模式并从中学习的能力上，而且还体现在其广泛的应用领域，如医疗诊断、金融分析、自动驾驶汽车、个性化教育和智能家居等。随着技术的进步，AI变得越来越普及，从企业到消费者，每个人都开始享受到由智能系统提供的便利和效率。无论是通过语音助手来简化日常任务，还是利用复杂的算法来优化业务决策，AI都正在逐步成为我们日常生活中不可或缺的一部分。
在这里插入图片描述

II. 机器学习基础

A. 机器学习概念

1. 定义和重要性

机器学习是一门涉及多个领域的交叉学科，它的核心在于使计算机模拟或实现人类的学习行为，以获取新知识和技能，并不断改善自身性能。

机器学习的定义和目的是通过让计算机从数据中自主学习，无需明确编程即可做出决策或预测。这一领域的目标包括从数据中自动发现模式和规律，利用这些发现来预测未来数据或未知情况。

机器学习的分类可以从不同的角度进行划分，如基于学习策略、学习方法、学习方式和数据形式等。这些分类方法有助于理解不同机器学习算法的特点和适用场景。

在实际应用中，机器学习可以用于解决各种问题，包括但不限于分类、回归、聚类等任务。它在医疗诊断、金融分析、图像识别、自然语言处理等领域都有着广泛的应用。

B. 机器学习步骤

机器学习的步骤可以概括为以下几个方面：

数据收集与处理：这是机器学习过程中的第一步，涉及到数据的获取和初步处理。数据需要具有代表性，并且数据量要合适。在这个阶段，我们通常使用工具如pandas来导入数据，并查看数据集的信息，包括数据形状、行数、列数等。
特征选择和工程：这一步骤包括对数据进行更深入的分析和预处理，如处理缺失值、重复值、数据类型的转换以及字符串数据的规整化。特征选择是识别出对预测结果最有影响的特征，而特征工程则是通过创建新特征或转换现有特征来提高模型的性能。
模型选择：在这一步，我们需要根据问题的性质选择合适的机器学习算法。机器学习算法大致可以分为监督学习、无监督学习和强化学习等类型。
训练和评估：选择好模型后，接下来的步骤是使用训练数据集来训练模型，并通过验证集来评估模型的性能。这一步骤可能会涉及到调整模型参数以获得更好的预测效果。
参数调整和优化：在模型训练和评估的过程中，可能需要对模型的参数进行调整以达到最优的模型性能。这通常涉及到超参数的调整，以及对不同算法或其组合的尝试。

C. 机器学习分类

机器学习的分类主要有以下几种：

监督学习：在监督学习中，我们有一个目标变量或结果变量，我们希望从特征变量或输入变量预测这个结果。监督学习可以分为两大类：分类和回归。分类问题是指预测数据的类别，例如垃圾邮件检测。回归问题则涉及预测数值型数据，如房价预测。
无监督学习：与监督学习不同，无监督学习没有目标变量，而是专注于发现数据中的模式或结构。无监督学习常用于聚类分析、关联规则学习和降维。
强化学习：强化学习是一种学习方法，其中模型（通常称为代理）通过与环境交互来学习行为，以最大化某种累积奖励。强化学习在游戏、机器人控制和自然语言处理等领域有着广泛的应用。
实例学习和迁移学习：这两种方法更多地关注如何将已经学习到的知识应用到新的问题或相关的任务上。

D. 机器学习实践

工具和库介绍：

Scikit-learn：这是一个非常受欢迎的Python机器学习库，它提供了许多简单高效的工具，用于数据挖掘和数据分析。Scikit-learn的优势在于它的易用性和对于入门到中级机器学习项目的适用性。
TensorFlow：这是一个开源的机器学习框架，由Google Brain团队开发。它灵活且强大，特别适合深度学习项目。
PyTorch：这是另一个流行的深度学习框架，以其动态计算图和易于理解的编程模型而闻名。它广泛用于研究和工业界的机器学习项目。
Numpy：这是Python的一个扩展程序库，支持大量的维度数组与矩阵运算，是科学计算的基础包。

E.实际案例研究

糖尿病数据线性回归预测

1.数据说明

diabetes 是一个关于糖尿病的数据集，该数据集包括442个病人的生理数据及一年以后的病情发展情况。

下面对数据集变量说明下，方便大家理解数据集变量代表的意义：

age:年龄

sex:性别

bmi(body mass index):身体质量指数，是衡量是否肥胖和标准体重的重要指标，理想BMI(18.5~23.9) = 体重(单位Kg) ÷ 身高的平方 (单位m)

bp(blood pressure):血压（平均血压）

s1,s2,s3,s4,s4,s6:六种血清的化验数据，是血液中各种疾病级数指针的6的属性值。

s1——tc，T细胞（一种白细胞）

s2——ldl，低密度脂蛋白

s3——hdl，高密度脂蛋白

s4——tch，促甲状腺激素

s5——ltg，拉莫三嗪

s6——glu，血糖水平

【注意】：以上的数据是经过特殊处理，
10个数据中的每个都做了均值中心化处理，然后又用标准差乘以个体数量调整了数值范围。验证就会发现任何一列的所有数值平方和为1。

2.导包

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

用于导入三个常用的数据处理和可视化库：numpy、pandas和matplotlib。

from sklearn.linear_model import LinearRegression

从sklearn库中导入线性回归模型。

3.导入数据

from sklearn.datasets import load_diabetes

从sklearn库中导入糖尿病数据集。

diabetes=load_diabetes()
data = diabetes['data']
target = diabetes['target']
feature_names = diabetes['feature_names']

加载糖尿病数据集，并将数据集的特征数据、目标数据和特征名称分别赋值给变量data、target和feature_names。

4.脱敏处理

df = pd.DataFrame(data,columns= feature_names)
df

在这里插入图片描述

使用pandas库创建一个DataFrame对象，并将数据和特征名称作为参数传递给DataFrame构造函数。然后，将创建的DataFrame对象赋值给变量df

5.抽取训练数据和预测数据

from sklearn.model_selection import train_test_split

从sklearn库中导入train_test_split函数。train_test_split函数用于将数据集划分为训练集和测试集

x_train,x_test,y_train,y_test = train_test_split(data,target,test_size=0.2)

使用train_test_split函数将数据集划分为训练集和测试集。其中，data表示特征数据，target表示目标数据，test_size=0.2表示将20%的数据作为测试集，剩余的80%作为训练集。划分后的训练集和测试集分别赋值给变量x_train、x_test、y_train和y_test。

6.创建模型

liner = LinearRegression()
liner.fit(x_train,y_train)

创建一个线性回归模型，并使用训练集数据进行拟合。首先，通过LinearRegression()创建一个线性回归模型对象，然后使用fit()方法将训练集的特征数据x_train和目标数据y_train传入模型进行拟合。

求线性方程: y = WX + b 中的W系数和截距b

df.head(4)

在这里插入图片描述

显示DataFrame对象df的前4行数据。head()方法默认返回前5行数据，但可以通过传入参数来指定返回的行数

系数w 系数大小类比权重

liner.coef_

在这里插入图片描述

获取线性回归模型的系数。coef_属性返回一个数组，其中包含模型中每个特征对应的系数值。这些系数表示了每个特征对目标变量的影响程度。

截距b

b= liner.intercept_
b

获取线性回归模型的截距。intercept_属性返回一个数值，表示模型中的截距值。截距是一个常数项，用于在特征数据为0时预测目标变量的值。

7.预测

y_pred = liner.predict(x_test)
y_pred

在这里插入图片描述

使用线性回归模型对测试集数据进行预测，并将预测结果赋值给变量y_pred。predict()方法接受一个特征数据集作为输入，并返回对应的目标变量预测值。

得分,回归的得分一般比较低

liner.score(x_test,y_test)

计算线性回归模型在测试集上的拟合优度得分。score()方法接受两个参数，分别是特征数据集和目标变量数据集，返回一个数值表示模型的拟合优度得分。在这里，输入的测试集特征数据为x_test，目标变量数据集为y_test，输出的拟合优度得分为liner.score(x_test, y_test)

8.线性回归评估指标

# metrics  评估

from sklearn.metrics import mean_absolute_error as mse

mse(y_test,y_pred)

计算线性回归模型在测试集上的均方误差（Mean SquaredError，MSE）。mean_absolute_error函数用于计算平均绝对误差，但在这里被重命名为mse。输入的参数为真实目标变量数据集y_test和预测目标变量数据集y_pred，输出的结果为均方误差。

9.研究每个特征和标记结果之间的关系.来分析哪些特征对结果影响较大

绘制一个包含10个子图的图表，每个子图显示一个特征与目标变量之间的关系

# 画子图
# 10个
# 2行五列
plt.figure(figsize=(15, 8))
for i, col in enumerate(df.columns):
    data = df[col]
    #     display(data)
    # 画子图
    ax = plt.subplot(2, 5, i + 1)
    ax.scatter(data, target)
    # 线性回归
    linear = LinearRegression()
    linear.fit(df[[col]], target)

    # 训练后得到w,b的值
    w = linear.coef_
    #     print(w)
    b = linear.intercept_
    #     print(b)
    #画预测的直线 ：y = wx+b
    x = np.array([data.min(), data.max()])
    y = w * x + b
    ax.plot(x,y,c='r')
    # 标题
    ax.set_title(f'{col}:{int(w[0])}')

在这里插入图片描述

10.结果

从以上分析可知，单独看所有特征的训练结果，并不没有得到有效信息，我们拆分各个特征与指标的关系，可以看出：

bmi与糖尿病的相关性非常高，bp也有一定的关系，但是是否是直接关系，还是间接关系，有待深入考察。其他血清指标多少都和糖尿病有些关系，有的相关性强，有的相关性弱。

III. 计算机视觉入门

A. 计算机视觉概念

计算机视觉是一门科学，它赋予机器模拟人类视觉系统的能力，用于识别、跟踪和测量图像中的目标，并进一步处理图像信息。
在这里插入图片描述

计算机视觉的概念始于20世纪60年代，当时科学家们开始探索如何使机器能够理解和解释视觉世界。随着技术的发展，特别是在深度学习的推动下，计算机视觉已经取得了显著的进步，现在它可以广泛应用于各个领域，如人脸识别、自动检测、导航系统等。

在应用领域方面，计算机视觉技术已经被应用于多个方向，包括图像分类、目标检测、图像分割、风格迁移、图像重构、超分辨率、图像生成和人脸等。这些应用涵盖了从基础的图像处理到复杂的机器学习和深度学习任务，如自动人工智能视觉检查、远程监控和自动化等方面。

计算机视觉的历史背景和技术进步可以分为几个重要阶段。在1960年代，计算机视觉的研究主要集中在二维图像的分析和识别上。到了1980年代，David Marr的著作《视觉》标志着计算机视觉成为了一门独立学科。此后，计算机视觉经历了马尔计算视觉、主动和目的视觉、多视几何与分层三维重建和基于学习的视觉等主要历程。

B. 基础知识和算法

计算机视觉的基础知识和算法涵盖了多个方面，包括图像处理基础、特征检测和描述以及目标识别和分类等。

图像处理基础：这是计算机视觉的基石，涉及到图像的预处理、增强、滤波等操作。这些操作有助于改善图像质量，为后续的图像分析提供更好的输入数据。
特征检测和描述：在图像中识别关键点（如角点、边缘等）的过程称为特征检测。而特征描述则涉及到如何描述这些关键点，以便能够在不同的图像中匹配它们。
目标识别和分类：这是指识别图像中的对象并对其进行分类。这通常涉及到使用机器学习算法，尤其是深度学习模型，如卷积神经网络（CNN），来训练系统识别特定的对象或类别。

C. 计算机视觉实践

在计算机视觉实践方面，OpenCV是一个非常重要的工具，它广泛应用于图像处理和计算机视觉领域。

OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉和机器学习软件库，它包含了多种优化算法，涵盖了图像处理、特征检测、目标跟踪等多个方面。使用OpenCV，可以实现各种复杂的图像处理任务，如图像融合、显著图绘制、图像翻转和镜像、条形码区域分割等。

除了OpenCV，还有许多其他优秀的计算机视觉项目值得学习和研究。例如，基于OpenCV和Tensorflow的深蹲检测器、利用OpenCV实现基于深度学习的超分辨率处理等。这些项目不仅展示了OpenCV的强大功能，也为我们提供了丰富的学习资源。

IV. NLP学习路线总结

A. NLP简介

自然语言处理（NLP）是一个结合计算机科学、人工智能和语言学的交叉学科，其目的在于使计算机能够理解、解析、操作以及生成人类语言。
在这里插入图片描述

以下是NLP学习路线的总结：

前置知识：
- 基础数学知识：包括高等数学、线性代数、概率统计等。
- 统计学基础：了解概率分布、假设检验、贝叶斯推理等统计方法。
编程语言：
- 掌握至少一种编程语言，Python 是进行 NLP 研究的常用语言，因其有丰富的库和框架支持。
机器学习基础：
- 学习机器学习的基本理论和方法，特别是统计学习方法，如条件随机场（CRF）等，这些在 NLP 领域非常重要。
深度学习：
- 学习深度学习基础知识，包括全连接网络、卷积神经网络（CNN）、循环神经网络（RNN）等，这些都是处理语言数据的常用模型。

B. NLP核心概念和技术

自然语言处理（NLP）的核心概念和技术包括语言模型、文本分类和聚类以及序列到序列模型。

语言模型：语言模型是NLP中用于预测单词序列概率的模型，它能够评估一个句子的流畅度和合理性。在自然语言处理中，语言模型通常用于文本生成、语音识别的解码等任务。
文本分类和聚类：文本分类是指将文本数据分配到预定义的类别中，这是一种监督学习任务。而文本聚类则是将文本分组的过程，属于无监督学习任务。这两种技术在信息检索、情感分析等领域都有广泛应用。
序列到序列模型：序列到序列模型是一种能够将输入序列转换为输出序列的模型，它广泛应用于机器翻译、语音识别和文本摘要等领域。这种模型能够处理不同长度的输入和输出，使其在处理自然语言数据时非常有效。

V. 深度学习如何入门

A. 深度学习概述

深度学习是一种基于人工神经网络的机器学习方法，与传统机器学习相比，它能够自动提取数据的高层次特征，适用于处理大规模复杂数据。
在这里插入图片描述

基础知识学习：

阅读关于深度学习的入门书籍，这些书籍通常会从基本的数学知识出发，深入浅出地介绍深度学习的原理和相关技术。
在线课程和视频教程也是学习深度学习的好资源，例如，深度学习入门+实战系列视频，涵盖了从深度学习框架介绍到开发环境安装等内容。

理论与实践结合：

在学习理论的同时，动手实践是非常重要的。可以通过编写简单的神经网络程序来加深对激活函数、反向传播等关键概念的理解。
使用Python语言进行编程实践，因为它是深度学习领域最常用的编程语言，并且有大量的库和框架支持，如TensorFlow和PyTorch。

参与社区和论坛：

加入深度学习相关的社区和论坛，如GitHub、Stack Overflow等，这些平台上有许多经验丰富的开发者和学者，他们的讨论和分享会对你的学习大有裨益。
关注领域内的专家和博主，他们经常分享最新的研究成果和技术动态，帮助你保持知识的更新。

项目实战：

尝试参与一些实际的深度学习项目，这可以是个人的小项目，也可以是开源项目的贡献。
通过实际操作解决实际问题，可以更好地理解深度学习模型的应用和优化过程。

持续学习和研究：

深度学习是一个快速发展的领域，新的研究成果和技术不断涌现。因此，持续学习和跟进最新的研究是非常必要的。

B. 深度学习框架

在选择深度学习框架时，TensorFlow、PyTorch和Keras是三个非常受欢迎的选项。

TensorFlow：

由Google开发，是最早的深度学习框架之一，拥有庞大的社区和丰富的资源。
设计哲学强调灵活性和可扩展性，支持多种平台，包括桌面、服务器和移动设备。
提供强大的可视化工具TensorBoard，有助于模型的调试和优化。
支持多种编程语言，如Python、C++、Java等，适用于不同开发者的需求。

PyTorch：

以其动态计算图（eager execution）而闻名，这使得编程更加直观，对于初学者和研究人员来说更加友好。
提供了灵活的深度学习构建块，使得复杂的模型构建变得简单快捷。
在学术研究领域非常流行，因为它的设计理念符合研究人员的习惯。

Keras：

是一个高层神经网络API，它能够运行在多个后端之上，目前主要是基于TensorFlow。
提供了简洁方便的代码，非常适合初学者入门深度学习。
由于是在TensorFlow的基础上再次封装的，运行速度可能不如TensorFlow快，但易于使用。

摘星月为妆。

关注

14
点赞
踩
25

收藏

觉得还不错? 一键收藏
2
评论
机器学习、计算机视觉与NLP：从基础到深度学习的综合指南

机器学习是一门涉及多个领域的交叉学科，它的核心在于使计算机模拟或实现人类的学习行为，以获取新知识和技能，并不断改善自身性能。机器学习的定义和目的是通过让计算机从数据中自主学习，无需明确编程即可做出决策或预测。这一领域的目标包括从数据中自动发现模式和规律，利用这些发现来预测未来数据或未知情况。机器学习的分类可以从不同的角度进行划分，如基于学习策略、学习方法、学习方式和数据形式等。这些分类方法有助于理解不同机器学习算法的特点和适用场景。
复制链接

扫一扫