深度学习笔记(1):前言

系列前言

十分有幸上了忆臻学长的车,并且接受了第一次考验,和煊煊一起在一个月之内使用业余时间学完吴恩达的深度学习五门课。
本系列博客,既是一份笔记与个人思考,(包括课堂要点整理和所有的作业实现),也是一次挑战的记录,更是一次无形的答卷。希望学长满意,希望大家喜欢。
开业大吉。

让我们将一切从二分类说起

无论是预测房价,比如给定房子的一些信息,判断可能的房价;判断声音类型文本类型,比如给定一段声音,判断这段声音是男声还是女声;还是判断图形是属于哪种类型的物体,比如判断图片是不是一只猫。这些都可以归类到深度学习问题中来,不过有一些是回归,有一些是分类等处理上还会有些许的差别。

我们先说一些前导知识:
单个数据:我们把每一个单个数据抽象成一个属性集合,比如说在预测房价的时候,当我们选定了我们建模所需要想考虑的因素,例如说:1)屋子的大小,2)屋子的朝向,3)屋子的楼层,4)屋子的新旧程度,5)屋子的地理位置,比如我们就选定了这5个属性作为考虑。那么我们就把每一个房子抽象成一组向量,x(i)=[size,toward,floor,age,location]T,当然,如果这是我们想要用有监督学习预测的训练数据,其对应着一个y值。如果这是一个图像,可能它的各种属性貌似不那么明显,但是我们仍然可以通过将其rgb数据调用出来作为特征进行抽取抽象,所以属性的获取也是不唯一的,会影响到模型的结果等。
总之,对于每一个数据,会得到一个不同的向量,来代表这个数据的输入,也会有一个y值,代表着这组输入会得到的y。那么我们实际上建模的,训练的,预测的,输入数据,也就是以这些向量作为最最基本的个体,它与y到底有着什么样的关系(如果是分类模型的话那就是和0,1有什么样的关系)。

训练集:比如我们现在有m个数据,比如m个房子,模型考察其n个属性,于是乎我们就可以将这n个数据的输入的列向量,一列列地拼接在一起,然后将他们对应的y一个个拼接到一起,便可以得到一个X矩阵和对应的Y矩阵,其规模为x_n×m与1×m。(当然我们也可以离散地去看待这一个个数据,不过向量化思考问题有助于我们在实际应用中提高运算效率,不过早优化晚优化没差啦)

测试集,留下一部分用来测试模型准确性的数据,这一部分在这里先按下不表。

学习神经网络,个人认为基础知识需要必须足够熟练微积分和线性代数。

小结,我们到底在干什么:
实际上,抽象来讲,我们在做的事情就是最后得到一个模型,里面有一些参数,是我们通过一些信息得到的训练出来的,之后当我们给予输入时,其输出能够实现一个预测,而模型的好坏,也就决定了我们预测的好坏。
而神经网络模型是其中一种我们要研究的,当前被广泛使用的有效模型

为什么神经网络模型几十年后再度兴起

两方面原因:
一方面是因为随着信息收集的积累,可利用的数据越来越多
一方面是计算机算力增加使得处理模型的能力越来越强。

而深度学习神经网络模型,相比于其他模型,虽然在小规模数据上不占有优势,但在大规模数据上的表现优异。所以在现有算力和数据量都在爆发的今天,复杂神经网络所能给予的预测的高准确度是其他算法无法比拟的。这里我们使用一个图像来大致说明一下
在这里插入图片描述

小结

介绍了一些最最最基本的概念,以及为什么神经网络模型在这几年兴盛的原因。当然很不全,因为很多东西可能笔者也疏漏掉,但是当我们再次提到的时候一定会再次说明的。下期见

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值