深度学习入门

本文介绍了深度学习的基本概念,包括神经网络、人工智能和机器学习的关系,以及Transformer模型。接着,详细阐述了数据处理、模型构建、训练过程,特别讨论了在训练大量样本时的随机梯度下降法。此外,还介绍了如何使用飞桨库实现波士顿房价预测任务,包括数据处理、模型设计和训练配置。文章最后提到了模型保存的重要性。
摘要由CSDN通过智能技术生成

一、基本概念
1.人工智能的前沿进展:大模型
Transformer:网络结构,可以建模长距离依赖,更容易并行计算
学习数据:预训练模型与微调,将未标注信息转化为带标注的信息,满足大模型的学习所需数据
基于Prompt,多任务统一学习范式:Transformer+Pretrain+Prompt
大模型技术:训练数据和模型参数超大的模型
大模型技术两个新特征:效果提示,从大炼模型到炼大模型
代价:对大算力需求高,框架挑战
产业利用:文生图,信息检索等
2.人工智能、机器学习和深度学习覆盖的技术范畴是逐层递减的
机器学习:本质是参数估计
算法构成的三要素:假设空间(模型的假设或表达),优化目标(评价或损失函数),寻解算法(优化、求解算法)
3.神经网络基本概念
三个核心点:
神经元。神经网络中每个节点称为神经元,由加权和、非线性变换组成。
多层连接。大量节点按照不同的层次排布,形成多层的结构连接起来。
前向计算(得到输出)和后向传播(更新参数)。

二、模型的构建和训练
1.数据处理
        将数据读取,原始数据是一维的,需要通过数据形状变换,形成一个二维矩阵;将数据集划分为训练集和测试集,训练集能够确定模型的参数,而测试集用于评判模型的效果,通常将80%的数据用作训练集;接下来对数据归一化处理((data-min)/(max-min)),使得模型的训练更加高效;最后将数据处理的操作封装成 load data 函数,以波士顿房价预测为例。

#1.数据读取
#导入需要用到的package
import numpy as np
import json
#读入训练数据
datafile='./work/housing.data'
data=np.fromfile(datafile,sep='')
data

#2.数据形状变换
feature_names=['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE',
               'DIS','RAD','TAX','PTRATIO','B','LSTAT','MEDV']
feature_num=len(feature_names)
data=data.reshape([data.shape[0]//feature_num,feature_num])

#3.数据集划分
ratio=0.8
offset=int(data.shape[0]*ratio)
training_data=data[:offset]
training_data.shape

#4.归一化处理
maximums,minimums=\
                  training_data.max(axis=0),\
                  training_data.min(axis=0),
for i in range(feature_num):
    data[:,i]=(data[:,i]-minimums[i])/(maximums[i]-minimums[i])

        封装成load data函数,便于下一步模型的调用:

def load_data():
    datafile='./work/housing.data'
    data=np.fromfile(datafile,sep='')

    feature_names&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值