初识机器学习

前言

        随着人工智能的不断发展,机器学习这门技术也越来越重要,笔者之前打数模比赛的时候,零零碎碎学过一点,但是还是一知半解,模棱两可,没有形成一个系统的知识体系,所以现在开始进行系统的学习,下面都是笔者自己的一些学习经验,希望对你有所帮助。


一、什么是机器学习?

        谈到机器学习,很多人可能听过这个词语,却不知道其真正的内容。​ 机器学习起源于上世纪50年代,1959年在IBM工作的Arthur Samuel设计了一个下棋程序,这个程序具有学习的能力,它可以在不断的对弈中提高自己。像我们熟知的alphago就是这样一个下棋的程序,不过它的学习能力更强大。

        机器学习,顾名思义,就是让机器去学习,计算机通过对大量数据的处理,发现数据中蕴含的规律。机器学习也是有方式的,根据对数据处理方式的不同,可以分为监督学习和非监督学习。

二、机器学习的方式

1、监督学习

​        监督学习就是使用已知的正确答案的示例来训练神经网络,将已知的数据与标记一一对应,训练一个预测模型。这样输入未知数据,提取特征值,可以映射到相应的标记。常见的监督学习使用例子有分类问题和回归问题。

        常见的监督学习算法:支持向量机(Support Vector Machine, SVM),朴素贝叶斯(Naive Bayes),逻辑回归(Logistic Regression),K近邻(K-Nearest Neighborhood, KNN),决策树(Decision Tree),随机森林(Random Forest),AdaBoost以及线性判别分析(Linear Discriminant Analysis, LDA)等。

        还有,深度学习大多也是依靠监督学习实现的。(关于深度学习的内容,笔者后续会另出一篇文章介绍。)

2、非监督学习

        非监督学习,适用于有数据集,但是并没有特殊标识的情况,通过监督学习,可以发现数据内在的关系结构。最常见的情况就是关联规则的学习以及“聚类”。

        常见的非监督学习算法:Apriori算法以及k-Means算法。

3、半监督式学习

        半监督式学习,顾名思义,就是输入的数据一部分有标记,一部分没有标记,最适合用来进行预测,像回归预测,分类等等。在日常使用情况下,就是通过对已标记数据建模,在此基础上,对未标记数据进行预测。

4、弱监督式学习

        这个概念比较难理解,可以简单的理解为,我们在进行监督学习时,需要对数据进行标记标签,但是数据标签是不完整,不准确的。例如在处理医学影像时,专家标记的成本高昂,常常只能获得部分标记或者不完全准确的标记。弱监督学习可以用于从这些不完整的标记中学习疾病检测、分割或分类模型。

        人们在日常生活中,一般只关注前面两种方法,但是由图像识别时存在很多标签值的缺失,所以弱监督学习在图像识别方面发挥一定的作用,也是一个热门的研究方向。

二、什么是神经网络

        神经网络是人们受人脑神经系统启发研发设计的一种计算模型,可以说,神经网络是整个机器学习,人工智能的核心。它由大量相互连接的简单单元(称为神经元)组成,这些神经元模拟了生物神经元之间的信号传递过程。

图片来源于:DeepLearning-500-questions

典型的神经网络由三种类型的层组成:

  1. 输入层:接收原始输入数据,并将其传递到网络中。

  2. 隐藏层:在输入层和输出层之间的层次,负责对输入数据进行特征提取和转换。

  3. 输出层:生成网络的最终输出,可能是分类、回归或其他类型的预测结果。

总结

        本文简单地讲解了机器学习中,监督学习以及神经网络的概念,笔者能力有限,加之文章速成,讲述中可能存在差错,希望大家可以批评指正。

  • 18
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值