随机梯度下降法底层

最新推荐文章于 2023-09-28 11:37:54 发布

争取不掉头发的我

最新推荐文章于 2023-09-28 11:37:54 发布

阅读量129

点赞数

分类专栏：底层实现

本文链接：https://blog.csdn.net/weixin_43698739/article/details/99874087

版权

底层实现专栏收录该内容

3 篇文章

订阅专栏

import numpy as np
import matplotlib.pyplot as plt

数据集创建

m= 100000

x=np.random.normal(size=m)
X=x.reshape(-1,1)
y=4.*x+3.+np.random.normal(0,3,size=m)

其实效用不大，但不定义，又违背了梯度下降算法的要求
求导
求y值

def J(theta,X_b,y):
    try:
        return np.sum((y - X_b.dot(theta))**2 )/len(X_b)
    except:
        return float('inf')
    
def dj_sgd(theta,X_b_i,y_i):
    return X_b_i.T.dot(X_b_i.dot(theta)-y_i )*2.

底层实现

def sgd(X_b,y,initial_theta,n_iters=5):
    '''
    initial_theta 样本特征比例
    
    n_iters   对于整个样本遍历的轮数
    '''
    t0=5
    t1=50
    m=len(X_b)
    
    def learning_rate(t):
        return t0 /(t+t1)

    theta = initial_theta
    for cur_iter in range(n_iters):
        indexs = np.random.permutation(m)   #随机索引乱序  达到能够全部都能够遍历
        X_b_new=X_b[indexs]  #用新的索引来进行排序
        y_b_new=y[indexs]
        for i in range(m):
            gradient = dj_sgd(theta,X_b[i],y[i])
            theta = theta - learning_rate(cur_iter*m+i) * gradient
    return theta

x_b=np.hstack([np.ones((len(X),1)),X])
initial_theta=np.zeros(x_b.shape[1])
theta=sgd(x_b,y,initial_theta)
theta

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

争取不掉头发的我

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

随机梯度下降SGD原理与代码实例讲解

余美丽的技术博客

12-11

390

随机梯度下降SGD原理与代码实例讲解关键词：随机梯度下降,SGD,机器学习,优化算法,梯度计算,梯度下降 1. 背景介绍 1.1 问题由来在机器学习领域，优化算法是保证模

梯度下降底层实现

weixin_43698739的博客

08-20

142

梯度下降首先要了解什么是梯度下降：在微积分里面，对多元函数的参数求∂偏导数，把求得的各个参数的偏导数以向量的形式写出来，就是梯度。比如函数f(x,y), 分别对x,y求偏导数，求得的梯度向量就是(∂f/∂x, ∂f/∂y)T,简称grad f(x,y)或者▽f(x,y)。对于在点(x0,y0)的具体梯度向量就是(∂f/∂x0, ∂f/∂y0)T.或者▽f(x0,y0)，如果是3个参数的向量梯度...

参与评论您还未登录，请先登录后发表或查看评论

批量梯度下降算法和随机梯度下降算法的代码实现

Mr_pan

03-07

2871

批量梯度下降算法和随机梯度下降算法的代码实现 随机梯度下降和批量梯度下降都是梯度下降方法的一种，都是通过求偏导的方式求参数的最优解。批量梯度下降算法：，。是通过对每一个样本求偏导，然后挨个更新。（对于大样本的实验，这种方法效率太低），而随机梯度下降算法则是从其中的所有样本中取出部分样本求偏导，对参数进行更新。#include "stdio.h" #include<iostream> usin

深度学习笔记之优化算法(二)随机梯度下降

静静的学习就好

09-28

412

本节将介绍随机梯度下降(Stochastic Gradient Descent,SGD)

随机梯度下降算法

qq_46439619的博客

01-22

232

小批量随机梯度下降算法（小批量SGD）每次从从训练样本集上随机抽取一个小样本集，求其误差的平均值，作为目标函数，将参数沿着梯度的方向移动，从而使当前的目标函数减少得最多。小样本集的个数为batch_size,通常为2的幂次方，有利GPU加速代价函数的总和为1m∑i=1mL(x(i),y(i),θ)\dfrac{1}{m}\sum_{i=1}^mL(x^{(i)},y^{(i)},θ)m1i=1∑mL(x(i),y(i),θ) 真SGD 每次随机选取一个样本，batch_size=1 遇上噪声容易陷

随机梯度下降法

lijf2001的博客

08-14

221

在学习此方法前，请先了解一下微积分（高数）的相关知识。梯度下降法一个十分困难的问题对于一个复杂的函数，有没有办法高效地求出它的一个最值？对于这个问题，不少数学家冥思苦想，但最终仍然行之有效的办法，那这个问题是不是无解了？其实也不一定，如果对于单峰函数，还是有解的。一个退而求其次的问题对于一个复杂的函数，有没有办法高效地求出它的一个极值？相比刚刚的那个问题，这个问题只需要求极值，而非最值，而且只需要求出一个即可。这样一来问题就有解了。先考虑极值有什么特征，梯度为0！因此，我们就可以利用梯度

牛客网算法八股刷题系列(二)卷积函数、随机梯度下降、ReLU

静静的学习就好

03-28

355

牛客网算法八股刷题系列——卷积函数、随机梯度下降、ReLU

Matlab实现SGD随机梯度下降算法

SGD（Stochastic Gradient Descent，随机梯度下降）是一种广泛应用于机器学习领域的优化算法，用于最小化一个函数。与传统的梯度下降方法相比，SGD的特点在于它在每一步迭代中使用一个样本或一小批样本来估计梯度，...

江苏省培育壮大数据企业行动方案（2025-2027年）.docx

04-08

江苏省培育壮大数据企业行动方案（2025-2027年）.docx

西门子200smart恒压供水系统PLC程序解析与应用

04-08

内容概要：本文详细解析了一个基于西门子200smart PLC的三泵联动恒压供水系统。该系统采用了“三层蛋糕”结构（底层硬件驱动、中间逻辑控制、上层HMI交互），并通过多个子程序实现了精确的压力控制、泵组调度、报警处理等功能。文中重点介绍了压力传感器数据处理、PID控制、泵组轮换机制、报警处理以及手动模式设计等方面的技术细节。此外，还分享了一些现场调试的经验教训，如量程转换、延时设置不当引发的问题及其解决方案。适合人群：从事工业自动化领域的工程师和技术人员，尤其是熟悉PLC编程和恒压供水系统的从业者。使用场景及目标：适用于需要深入了解西门子200smart PLC编程技巧、恒压供水系统设计思路的人群。目标是帮助读者掌握如何构建稳定可靠的恒压供水控制系统，提高系统性能并减少故障发生。其他说明：文章不仅提供了详细的代码片段和配置方法，还结合实际案例讲解了许多容易忽视但至关重要的细节，有助于提升读者的实际操作能力。

基于STM32设计的数字示波器全套资料（原理图、PCB图、源代码）

04-08

基于STM32设计的数字示波器全套资料（原理图、PCB图、源代码）硬件平台：主控器：STM32F103ZET6 64K RAM 512K ROM 屏幕器：SSD1963 分辨率：480*272 16位色触摸屏：TSC2046 模拟电路： OP-TL084 OP-U741 SW-CD4051 CMP-LM311 PWR-LM7805 -LM7905 -MC34063 -AMS1117-3.3 DRT-ULN2003 6.继电器：信号继电器 7.电源：DC +12V 软件平台：开发环境：RealView MDK-ARM uVision4.10 C编译器：ARMCC ASM编译器：ARMASM 连机器：ARMLINK 实时内核：UC/OS-II 2.9实时操作系统 GUI内核：uC/GUI 3.9图形用户接口底层驱动：各个外设驱动程序数字示波器功能：波形发生器：使用STM32一路DA实现正弦，三角波，方波，白噪声输出。任意一种波形幅值在0-3.3V任意可调、频率在一定范围任意可调、方波占空比可调。调节选项可以通过触摸屏完成设置。 SD卡存储： SD卡波形存储输出，能够对当前屏幕截屏，以JPG格式存储在SD卡上。能够存储1S内的波形数据，可以随时调用查看。数据传输：用C#编写上位机，通过串口完成对下位机的控制。（1）实现STOP/RUN功能（2）输出波形电压、时间参数（3）控制截屏（4）控制波形发生器（5）控制完成FFT（6）波形的存储和显示图形接口： UCGUI 水平扫速： 250 ns*、500ns、1μs、5 μs、10μs、50μs、500 μs、5ms 、50ms 垂直电压灵敏度：10mV/div, 20mV/div, 50mV/div, 0.1V/div, 0,2V/div, 0.5V/div, 1V/div,2V/

基于Copula函数的风电场概率潮流高效计算方法及其应用

04-08

内容概要：本文详细介绍了如何使用Copula函数模型解决风电场出力相关性问题，并结合三点估计法（3PEM）进行概率潮流计算。首先，文章指出传统方法如正态分布假设无法有效处理风电场出力的非线性相关性，而Copula函数能够将边缘分布和相关结构分离处理，从而提高计算精度。文中提供了具体的Python代码示例，展示了如何构建Gaussian Copula模型以及进行Nataf变换，确保生成的样本符合实际物理空间的分布特征。此外，文章还强调了在处理多风电场场景时需要注意的问题，如协方差矩阵的正则化处理和Copula模型的选择。最后，通过实例验证，证明了该方法不仅提高了计算效率，还将电压越限概率的误差控制在较低范围内。适合人群：从事电力系统研究、风电场规划与运营的技术人员，以及对概率潮流计算感兴趣的科研工作者。使用场景及目标：适用于需要精确评估风电场出力相关性和进行概率潮流计算的场合，旨在提高计算效率和精度，优化电网调度决策。其他说明：文章提醒读者在选择Copula模型时需根据具体数据特点进行调整，避免盲目套用特定模型导致拟合效果不佳。同时，在实际应用中应注意验证生成样本的统计特性，确保模型的有效性和可靠性。

Delphi 12.3控件之东软数据平台-SM4-加解密-demo.7z