![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
强化与提高
闲看庭前梦落花
摆脱不够努力、不够勤奋、不专注带来的焦虑
展开
-
ZTE捞月比赛
官方代码test-TFimport osimport numpy as npimport rawpyimport tensorflow as tfimport skimage.metricsfrom matplotlib import pyplot as pltfrom unetTF import unetimport argparsedef normalization(input_data, black_level, white_level): output_data =原创 2022-04-13 16:31:11 · 251 阅读 · 0 评论 -
强化学习运行代码traffic
强化学习运行代码模板使用已经定义好的DQN网络highspeedracing对图片进行处理自己学习更好的理解强化学习的操作使用使用已经定义好的DQN网络import tensorflow as tf import numpy as np import randomfrom collections import deque # Hyper Parameters:FRAME_PER_ACTION = 1GAMMA = 0.99 # decay rate of past observation原创 2022-03-29 15:27:58 · 330 阅读 · 0 评论 -
强化学习flappy-bird代码阅读理解
强化学习flappy_bird代码阅读理解导入所需要的库,以及一些参数的定义建立网络训练网络导入所需要的库,以及一些参数的定义import tensorflow as tffrom __future__import print_functiontf=tf.compat.v1import syssys.path.append('game/') #相当于规定当前目录import wrapped_flappy_bird as gameimport randomimport numpy as n原创 2022-03-29 10:18:44 · 5601 阅读 · 0 评论 -
强化学习1
强化学习强化学习强化学习的交互过程强化学习-贝尔曼方程总结Q-learning算法Flappy Bird游戏Deep Q-Network实现方法构建模型强化学习强化学习:是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。这个方法具有普适性,因此在其他许多领域都有研究。强化学习是智能体以试错的方式进行学习:通过与环境进行交互获得的奖赏指导行为。原创 2022-03-28 20:47:56 · 5030 阅读 · 0 评论 -
模型的压缩
模型压缩知识蒸馏代码执行彩票假说:随机初始化权重,得到训练后权重,若训练效果不好则再次随机初始化,训练效果好剪枝原始随机初始化。网络剪枝:剪枝后性能下降(期望不要下降太多),要慢慢剪枝一次不要剪太多。网络剪枝问题:权重剪枝:难以实现难以加速,网络结构变得不规整。神经元剪枝:容易实现容易加速、网络结构规整知识蒸馏教师网络:大规模网络模型,集成网络,极深网络模型学生网络:简单网络模型代码模型class Student(nn.Module): def __init__(self,img_c=原创 2022-03-22 09:55:14 · 190 阅读 · 0 评论 -
算法进阶迁移学习
算法进阶迁移学习加载数据集训练加载数据集class Image_Data(Dataset): def __init__(self,img_h=128,img_w=128,path,mode='train',process=True): self.img_h=img_h self.img_w=img_w self.path=path self.mode=mode self.process=process if self.mode is 'train': self.path=原创 2022-03-21 21:36:28 · 121 阅读 · 0 评论 -
生成对抗学习
生成对抗学习自动编码器复习生成式对抗网络介绍训练判别器训练生成器数据集模型构建生成器判别器模型训练自动编码器复习核心目标:构建输入等于输出用途:降维、特征提取、初始化深度网络训练方式:梯度下降+反向传播生成式对抗网络介绍最小最大游戏(零和博弈)游戏双方分别是生成器和判别器。生成器学习伪造数据,判别器学习判断数据的真实性。为了胜利双方不断自我优化,各自提高生成能力和判别能力,最终以假乱真。训练判别器真实数据集中采样数据,并标记为1。生成器随机采样数据,并标记为0。锁定生成器不训练,反向原创 2022-03-21 20:51:46 · 4049 阅读 · 0 评论 -
图像分割应用 Unet
@TOC自动编码器复习自动编码器的训练过程学习目标:输入特征等于输出特征训练结果:编码器的处处(压缩特征)是更抽象,更健壮的高级特征。图像切割应用导入需要的包import torchfrom torch.utils.data import DataLoader,Datasetfrom torch import nnfrom torchvision import transformsfrom PIL import Imageimport osfrom torchvision.util原创 2022-03-20 16:40:36 · 4147 阅读 · 0 评论 -
torch常规训练方式
torch常规训练方式导入数据与数据增强构建模型加载模型和数据训练通过已有数据的导入进行训练导入数据与数据增强import torchvisiontrain_data=torchvision.dataset.CIFAR10( root='./', train=True, transform=transform_train, down=True)#数据增强transoform_train=torchvision.transforms.Compose([ transforms.Rando原创 2022-03-18 17:37:14 · 592 阅读 · 0 评论 -
1.动手编写自动编码器
1.动手编写自动编码器导入所需模块读取数据构建模型实例化参数绘制原始图像训练导入所需模块import numpy as npimport matplotlib.pyplot as pltimport torchimport torch.utils.data as Dataimport torchvisionimport torchvision.transforms as transformimport torch.nn as nn读取数据train_data=torchvision.d原创 2022-03-18 17:04:25 · 1680 阅读 · 0 评论 -
模型可解释性
模型可解释性迁移学习自动编码器模型压缩生成对抗学习给出的理由是商业,法律,人文的要求。基于可解释提高机器学习性能可解释机器学习的重要目标:让人感觉安全与可控(可解释性也是一种学习任务)深度学习很难解释:反向传播,梯度消失,特征学习,局部最优,各种结构。模型能力越强越难解释,深度学习执行的任务本身就很难解释。利用梯度解释模型:计算像素值对应分类得分的梯度值。迁移学习重用已有知识机器学习角度:一个写通过将别的相关领域中的知识应用到本应用中的学习模式。迁移学习要解决的问题:给定一个研究领域和原创 2022-03-18 16:27:03 · 2991 阅读 · 0 评论 -
机器学习算法提高
机器学习算法提高贝叶斯网络粒子滤波高斯过程贝叶斯网络贝叶斯方法:贝叶斯派思考问题的固定模式:先验分布+样本信息=后验分布其中先验信息一般来源于经验和历史资料贝叶斯公式:贝叶斯网络,又称新年网络,或有向无环图模型,是一种概率模型。贝叶斯网络三种形式:head-to-heag,tail-to-tail、head-to-tail粒子滤波随机选取预测域的N个点,称为粒子。以此计算出预测值,并算出在测量域的概率,即权重,加权平均就是最优估计。之后按权重比例,重采样,进行下次迭代。粒子滤波是一种原创 2022-03-17 20:04:38 · 459 阅读 · 0 评论