第一章 机器学习

本文介绍了机器学习中的关键步骤,包括数据预处理、特征提取与转换,强调了特征处理在提升模型性能中的重要性。特征工程是机器学习问题的核心,涉及到如何有效地表示和选择特征。尽管预测模型的构建是重要环节,但实际操作中,特征选择和抽取对最终预测准确性的贡献不容忽视。
摘要由CSDN通过智能技术生成

机器学习

机器学习Machine Learning, ML)是指从有限的观测数据学习(或“猜测”)出具有一般性的规律,并利用这些规律对未知数据进行预测的方法。

  • 传统的机器学习主要关注如何学习一个预测模型。一般需要首先将数据表示为一组特征(Feature)特征的表示形式可以是连续的数值、离散的符号或其他形式。然后将这些特征输入预测模型,并输出预测结果
    【这类机器学习可以看作浅层学习Shallow Learning),浅层学习的一个重要特点是不涉及特征学习,其特征主要靠人工经验或特征转换方法来抽取。】
  • 不同数据的特征构造方式差异很大
    对于图像这类数据,我们可以很自然地将其表示为一个连续的向量【将图像数据表示为向量的方法有很多,比如直接将一幅图像的所有像素值(灰度值或RGB)组成一个连续向量。】。而对于文本数据,因为其一般由离散符号组成,并且每个符号在计算机内部都表示为无意义的编码,所以通常很难找到合适的表示方式。
  • 实际任务中使用机器学习模型一般包含以下步骤:

(1)数据预处理:经过数据的预处理,如去除噪声等。
【比如在文本分类中,去除停用词等。】
(2)特征提取:从原始数据中提取一些有效的特征。
【比如在图像分类中,提取边缘、尺度不变特征变换(Scale Invariant Feature Transform, SIFT)特征等。】
(3)特征转换:对特征进行一定的加工,比如降维或升维。
降维包括特征抽取(Feature Extraction)特征选择(Feature Selection)两种途径。常用的特征转换方法主成分分析(Principal Components Analysis, PCA)线性判别分析(Linear Discriminant Analysis, LDA࿰

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值