python非线性最小二乘拟合_非线性函数的最小二乘拟合——兼论Jupyter notebook中使用公式 [原创]...

突然有个想法,利用机器学习的基本方法——线性回归方法,来学习一阶rc电路的阶跃响应,从而得到rc电路的结构特征——时间常数τ(即r*c)。回答无疑是肯定的,但问题是怎样通过最小二乘法、正规方程,以更多的采样点数来降低信号采集噪声对τ估计值的影响。另外,由于最近在捣鼓jupyter和numpy这些东西,正好尝试不用matlab而用jupyter试试看。结果是意外的好用,尤其是在jupyter脚本中插入latex格式的公式的功能,真是太方便了!尝试了直接把纸上手写的公式转换到jupyter脚本中的常见工具软件。

以下原创内容欢迎网友转载,但请注明出处:

一、理论推导

1.线性回归分析及正规方程

传统意义说,线性回归问题是用最小二乘法(即正规方程),解决线性方程组的均方误差最小化问题。已知输出输入x是由多个变量构成的行向量,w是系数向量(列向量),b为偏置

fb4da6926863974890babdc954066190.png

在机器学习中,把每次的输入x作为一行组成更大的矩阵,即每一行代表一个样本,该矩阵称为设计矩阵x(train)。若样本数为k,则x(train)有k行,每个样本都会得到一个输出y,将y集合成一个列向量y(train),k个相同的b也组成列向量b。为简化表达,将b简化为附加在系数列向量w最后的常数b,x(train)则在每行的最后增加一个1,w(列向量)的最后增加一个待估计的b。为了使估计的结果:

dad407dcb88551d93ec6f08b51a12cef.png

和y(train)之差的平方和最小,有正规方程可以求解w:

e564e44ebee0aaf23d02bf9ce440f23f.png

2.一阶rc电路的阶跃响应

一阶rc电路的电路模型如下图所示。

f3ce25cd8c9b28cec6ae2137810a40a0.png

图1 一阶rc电路

幅度为vcc的阶跃信号从vin处输入,在vout处测量输出。解微分方程可得自变量为时间t的响应函数。

ea2ac2b299f99c16b0d1e94b6c3021d8.png

其中时间常数τ = r*c。我希望通过测量阶跃信号输入条件下,实际rc电路的响应曲线v(t),并通过v(t)来估计时间常数τ。如果做纯理论推导,只要知道任意时刻t0的输出电压v(t0)就可以解方程(2)得到τ。但在实际电路中电压v(t0)的测量往往受到诸多干扰的影响,并不准确。是否可以测量多个t值时刻对应的v(t),并利用正规方程(1)得到一个统计意义上最优的估计

a71896e4e3e958844c10efa7c410ac37.png呢?是接下来要解决的问题。

3.非线性函数的最小二乘估计

仔细观察适用正规方程的目标函数(0)式的特点,可以发想让非线性的要让(2)式能够使用正规方程,必须让:

1)     含有待估计的变量τ的函数充当(0)式中的系数w,而设计矩阵x(train)则可以由含有时间t或测量电压v(t)的函数充当。

2)     w和x(train)之间的关系必须是简单的相乘。

显然,只有用时间t的序列充当设计矩阵x(train),才有可能使w和x(train)之间的关系必须是相乘。至于其他的非线性部分则可以通过等效变换,变换到等式的另一侧来充当y(train)。综上,可以将(2)式变换为(3)式。

3080dea1e93aaf4f1f91071856d3709f.png

(3)式的整个左边可以计算得到y(train);(3)式右边的时间t的序列在构成设计矩阵x(train),1/τ则构成相当于(0)式中的系数矩阵w。这样就可以通过正规方程(2)式来求解统计意义上最优的估计

a71896e4e3e958844c10efa7c410ac37.png了。当然,从(3)式也可以看出,经过线性校正的模型中系数向量w只有一个元素——是个标量,偏置b也是恒等于0的。

二、仿真模型

想利用最近正在尝试使用的jupyter和numpy替代熟悉的matlab,验证上述非线性函数最小二乘估计的想法。下面先建立一个模型:

1)     输入为幅度vcc为3.3v的阶跃信号;

2)     时间常数τ为0.1秒;

3)     简单模拟采样间隔的随机性:是间隔等于delta1=0.0015秒和delta1=0.0011秒的两个序列的叠加。

4)     采样总长度为n=5倍τ;

5)     信号上叠加了幅度约为20mv的白噪声——至于为什么是20mv,将在后续部分详细介绍。

利用python和numpy进行数值仿真的代码如下:

1 import numpy as np

2 import matplotlib.pyplot as plt

3 tao=0.1#时间常数

4 vcc=3.3#电源电压

5 n=5#时长取时间常数tao的n倍

6 delta1=0.0015#第一种采样间隔

7 delta2=0.0011#第一种采样间隔

8 t1=delta1*np.arange(np.ceil(n*tao/delta1))

9 t2=delta2*np.arange(np.ceil(n*tao/delta2))

10 t=np.append(t1,t2)#为演示最小二乘拟合的功能,故意结合两种采样率下的时间点

11 t.sort()#对t进行排序

12 plt.plot(t)

13 s=vcc*(1-np.exp(-t/tao))#理论的波形曲线

14 plt.plot(t,s)#注意这里的plot函数使用了x轴和y轴两个轴,因为s中的数据不是均匀的

15 n_amp=np.exp(-n)*vcc

16 n_amp

17 noise = np.random.uniform(-n_amp, n_amp, (len(t)))#噪声:正负np.exp(-5)*3.3之间均匀分布

18 s_nr=s+noise#加入噪声后的信号

19 plt.plot(t,s_nr)

20 yt=np.log(vcc/(vcc-s_nr))

21 plt.plot(t,yt)

22 yt=np.mat(yt)

23 yt=yt.t

24 x=np.mat(t)#将x转换为矩阵数据类型

25 x=x.t#正规方程中的x应该是个列向量

26 w=(np.linalg.inv(x.t*x))*x.t*yt#求解正规方程

27 e_tao = np.round(1/float(w),4)#对时间常数的tao的估计,保留到4位小数

28 e_tao

说明:

1)     其间序列包含了两个等差数列t1和t2的融合,它们的间隔互质,没有重复,目的是模拟采样时间的随机性。最后用sort()方法又对时间序列进行排序的目的是为了后续容易观察波形更直观。如果仅仅为了使用正规方程,是不需要重新排序的。

2)     校正的非线性方程(3)和原始方程(2)相比有一个重大的缺陷就是:左侧求对数的括号内的数值不能为负——如果是纯理论推导,这是不可能发生的。但假如随机噪声后的v(t)是有可能大于阶跃幅度vcc的,此时括号内将变为一个负数,使得计算变得没有意义。我的解决之道是将假如的随机噪声幅度限制在仿真截止时刻v(t)和vcc之差的范围内,及代码中的n_amp。由于仿真的结束时刻为n(=5)个τ,所以n_amp的值等于np.exp(-n)*vcc。

这样做没有任何理论依据,仅仅是受限于(3)和(2)式之间的非完全等价变换——属于线性化校正需要付出的代价。

3)     由于待估计的参数只有一个(1/τ)所以正规方程的解也是只有一个元素的矩阵。将其转换为标量后取倒得到最优估计

a71896e4e3e958844c10efa7c410ac37.png

三、结果评估

加入噪声后的信号如下图所示,与通常情况的实测波形吻合度很高。

68148cc247876b202e1ba6faf6f26bf7.png

图2 模拟产生的带有噪声的阶跃响应

对这些加入噪声的信号进行线性校正后得到进行最小二乘估计的信号yt为下图所示。其基本趋势是一条斜率为(1/τ)的直线,和我预计的结果一样。

9acaa4bd604aa0e6d7e3bc45474aeed6.png

图3 对图2进行线性校正后的待估计信号

但可以明显的看到,由于(3)式左侧在v(t)的大小接近vcc时对加入的白噪声进行了放大。因此当t递增时,由白噪声造成的信号的不确定性大大增加了。也就是在套用正规方程时,t值较大时的噪声对结果的影响大于t值较小时的噪声对结果的影响。这是使用非线性校正函数需要付出的重要代价。

另外,多次运行以上代码的得到 都是一个略小于实际τ(=0.1)的数值——约为0.099左右,也就是说, 不是无偏估计。这应该是由于线性校正函数((3)式左侧),对于噪声noise大于0和小于0的部分进行了非对称的变换造成的。这虽然造成的偏差不大,但也是使用非线性校正函数需要付出的代价。

四、jupyter notebook

上述练习的一个重要目的是练习使用jupyter notebook,并在其中内嵌具有很好交互性的公式等信息。以下是部分程序运行效果的截图,虽然我对markdown语法还不熟悉,格式和排版还不够漂亮,但还是能够明显的提高代码的可读性。

82c6dded838c83635f6349b37614b329.png

图4 jupyter notebook运行效果截图

其中需要重点记录下的是公式代码的嵌入过程:

1)我首先在纸上手写了一些公式,用手机对其拍照,如:

fd4135553e6c7cd73117aed7d1d951d0.png

图5 手写的公式

2)用mathpix tools对这些照片截图,并扫描(mathpix tools有windows版和ios版,均可免费试用)。mathpix可以直接得到latex格式的公式表达式。下图是ios版本的mathpix界面截图。

68325eaa0363e07b0c2efbd4b18cd993.png

图6 ios版本的mathpix截图

3)在jupyter notebook上部的下拉菜单中选择单元格的格式为markdown;将latex格式的公式表达式粘贴到该单元格内,并在latex公式表达式的前后加上“$$”符号,运行该单元格即可得到图4所示效果的公式了。

c742e161a5699747b8df8811b12be301.png

图7 在jupyter notebook中输入latex公式

五、进一步的实际测试

工作做到这里离其实并没有完,还应该做一个简单的实际电路实测一下。我会在后续的假期中抽半天时间,在stm32开发板上完成这个工作:用gpio产生一个节约信号后,连续采集5个τ时间长度的信号,并代入正规方程求解,欢迎大家继续关注更新。

……

希望与广大网友互动??

点此进行留言吧!

表情包
插入表情
评论将由博主筛选后显示,对所有人可见 | 还能输入1000个字符
相关推荐
<p> <span style="font-size:14px;color:#E53333;">限时福利1:</span><span style="font-size:14px;">购课进答疑群专享柳峰(刘运强)老师答疑服务</span> </p> <p> <br /> </p> <p> <br /> </p> <p> <span style="font-size:14px;"></span> </p> <p> <span style="font-size:14px;color:#337FE5;"><strong>为什么需要掌握高性能MySQL实战?</strong></span> </p> <p> <span><span style="font-size:14px;"><br /> </span></span> <span style="font-size:14px;">由于互联网产品用户量大、高并发请求场景多,因此对MySQL性能、可用性、扩展性都提出了很高要求。使用MySQL解决大量数据以及高并发请求已经是程序员必备技能,也是衡量一个程序员能力和薪资标准之一。</span> </p> <p> <br /> </p> <p> <span style="font-size:14px;">为了让大家快速系统了解高性能MySQL核心知识全貌,我为你总结了</span><span style="font-size:14px;">「高性能 MySQL 知识框架图」</span><span style="font-size:14px;">,帮你梳理学习重点,建议收藏!</span> </p> <p> <br /> </p> <p> <img alt="" src="https://img-bss.csdnimg.cn/202006031401338860.png" /> </p> <p> <br /> </p> <p> <span style="font-size:14px;color:#337FE5;"><strong>【课程设计】</strong></span> </p> <p> <span style="font-size:14px;"><br /> </span> </p> <p> <span style="font-size:14px;">课程分为四大篇章,将为你建立完整 MySQL 知识体系,同时将重点讲解 MySQL 底层运行原理、数据库性能调优、高并发、海量业务处理、面试解析等。</span> </p> <p> <span style="font-size:14px;"><br /> </span> </p> <p> <span style="font-size:14px;"></span> </p> <p style="text-align:justify;"> <span style="font-size:14px;"><strong>一、性能优化篇:</strong></span> </p> <p style="text-align:justify;"> <span style="font-size:14px;">主要包括经典 MySQL 问题剖析、索引底层原理和事务与锁机制。通过深入理解 MySQL 索引结构 B+Tree ,学员能够从根本上弄懂为什么有些 SQL 走索引、有些不走索引,从而彻底掌握索引使用和优化技巧,能够避开很多实战遇到“坑”。</span> </p> <p style="text-align:justify;"> <br /> </p> <p style="text-align:justify;"> <span style="font-size:14px;"><strong>二、MySQL 8.0新特性篇:</strong></span> </p> <p style="text-align:justify;"> <span style="font-size:14px;">主要包括窗口函数和通用表表达式。企业许多报表统计需求,如果不采用窗口函数,用普通 SQL 语句是很难实现。</span> </p> <p style="text-align:justify;"> <br /> </p> <p style="text-align:justify;"> <span style="font-size:14px;"><strong>三、高性能架构篇:</strong></span> </p> <p style="text-align:justify;"> <span style="font-size:14px;">主要包括主从复制和读写分离。在企业生产环境,很少采用单台MySQL节点情况,因为一旦单个节点发生故障,整个系统都不可用,后果往往不堪设想,因此掌握高可用架构实现是非常有必要。</span> </p> <p style="text-align:justify;"> <br /> </p> <p style="text-align:justify;"> <span style="font-size:14px;"><strong>四、面试篇:</strong></span> </p> <p style="text-align:justify;"> <span style="font-size:14px;">程序员获得工作第一步,就是高效准备面试,面试篇主要从知识点回顾总结角度出发,结合程序员面试高频MySQL问题精讲精练,帮助程序员吊打面试官,获得心仪工作机会。</span> </p>
©️2020 CSDN 皮肤主题: 1024 设计师:白松林 返回首页