开发者分享|『啃书吧:深度学习与MindSpore实践』第二期 回归分析

本文介绍了线性回归在机器学习中的应用,包括单特征值的线性回归、交叉熵误差的概念以及多个属性的线性回归问题。通过实例展示了如何解决二维和多维线性回归,并强调了数学在理解深度学习基础中的重要性。同时,提到了线性回归、多项式回归和逻辑回归等常见回归分析方法。
摘要由CSDN通过智能技术生成

第二篇:2.1 回归问题算法

初读:2020年11月20日-2020年11月25日

啃书进度会在目录中标出来。本次目标是完成第二章2.1节回归问题算法(P14-P16)。

这一节讲了三个问题:

  • 只有一个特征值的线性回归问题

  • 简单介绍交叉熵

  • 多个属性的线性回归问题

关于线性回归的作用,P14有这样一句话很提神:线性回归是一个很简单的算法使用它可以快速地了解很多关于深度学习的基础知识。既然线性回归与很多基础知识有关,我决定给予充分重视,一定要把这部分啃透。可是这一节只有短短三页的空间,每个问题都没有充分展开,所以把这一部分的内容顺下来还要依靠一些外部资料。闲话到此,以下干货。

书中对回归问题算法的定义:通常是利用一系列属性来预测一个值,且预测的值是连续的。例如: 

  • 根据一套房子的特征数据,如面积、卧室数等来预测房价

  • 利用一周的气温变化和卫星云图来预测未来的气温情况

  • 灌溉渠道水的流速Y与水深x之间的关系(高中数学选修1-2)

  • 市场趋势预测、产品质量管理、客户满意度调查、投资风险分析(李航:统计学习方法)

机器学习中常用的回归分析:

  • 线性回归(Linear Regression)

  • 多项式回归(Polynomial Regression)

  • 逻辑回归(Logistic Regression)

本节重点介绍线性回归。

01

只有一个特征值的线性回归问题

表2.1 给定数据

02

交叉熵误差(Cross Entropy Loss)

交叉熵误差用于评估分类模型的表现。书中给出的是二分类问题的交叉熵误差的公式:

03

多个属性的线性回归问题

当输入变量从一个属性扩展到多个属性,问题就变复杂了。我试了用配方法推导两个属性的回归问题,只能恨脑袋窍开得太少。当输入属性增加以后,需要用到更高级的数学方法。

(1)数据集:设数据集内有m组数据,表示为

一步得出结果,而且与使用配方法求得到的系数是一样的。再画一下图象:

跟前面绘制的回归直线一样。再试试当输入变量有多个属性的情况。为了可视化方便,中尝试两个属性的回归问题。先把给定数据集简单改造一下。数据怎么改都行,只要属性之间线性无关即可,否则奇异矩阵会导致不满秩的问题,回归计算会出错。我直接把输入变量顺序倒过来作为第二个属性的特征值:

再看看回归的效果,看一下在三维坐标系中能不能绘出一个平面

眼见为实,我们的确得到了一个回归平面。建议使用%matpotlib魔术命令,这样就会打开独立的绘图窗口,好处是可以用鼠标拖动翻转图象,方便从各个方面观察图形。

今天先到这。感觉机器学习里数学很重要,也很高深,即使是这样一点点入门的线性回归知识花费了我我整整啃了一个星期的时间。路漫漫其修远兮,不能心急。

04

写在最后

这真是一本真正实战的书,第一章谈风清云淡,第二章开始惊涛骇浪。实战书不给公式推导过程是可以接受的,不过啃起来实在是吃力。好在有周边的学习资源辅助,缺失的拼板可以找到。

另外一个比较头大的问题是数学符号。比如数据集元素的上下标,这本书与跟统计学习方法是相反的。我估计每本书的作者都用有点自己的脾气。所以我们看不同的书相互参照的时候,最好先看清楚符号定义。

最后,啃书吃力,码字不易,觉得有用请友情留个喜欢以资鼓励。有表述不正确的地方,请大神们不吝指正。

今年的华为开发者大会 HDC 2020 上,除了**昇腾、鲲鹏等自研芯片硬件平台**之外,最令人期待的就是**深度学习框架 MindSpore 的开源**了。今天上午,华为 MindSpore **首席科学家陈雷**在活动中宣布这款产品正式开源,我们终于可以在开放平台上一睹它的真面目。 本文是根据机器之心报道的MindSpore 的开源介绍而整理的.md笔记 作为一款支持**端、边、云独立/协同的统一训练和推理框架,华为希望通过这款完整的软件堆栈,实现**一次性算子开发、一致的开发和调试体验**,以此帮助开发者实现**一次开发,应用在所有设备上平滑迁移**的能力。 三大创新能力:新编程范式,执行模式和协作方式 由**自动微分、自动并行、数据处理**等功能构成 开发算法即代码、运行高效、部署态灵活**的**特点**, 三层核心:从下往上分别是**后端运行时、计算图引擎及前端表示层**。 最大特点:采用了业界最新的 **Source-to-Source 自动微分**,它能**利用编译器及编程语言的底层技术**,进一步**优化以支持更好的微分表达**。主流深度学习框架中主要有**三种自动微分技术,才用的不是静态计算图、动态计算图,而是基于**源码**转换:该技术源以**函数式编程框架**为基础,以**即时编译(JIT)**的方式**在中间表达(编译过程中程序的表达形式)上做自动微分变换**,支持**复杂控制流场景、高阶函数和闭包**。 MindSpore 主要概念就是张量、算子、单元和模型 其代码有两个比较突出的亮点:计算图的调整,动态图与静态图可以一行代码切换;自动并行特性,我们写的串行代码,只需要多加一行就能完成自动并行。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值