实战
文章平均质量分 52
Tialyg
努力提升中…
读研ing
展开
-
【python】python文件操作
2.read()、readline() 、readlines()3.write()、writelines( )write()要写入字符串writelines()既可以传入字符串又可以传入一个字符序列,并将该字符序列写入文件。 注意必须传入的是字符序列,不能是数字序列。4. f.close() f.closed()5.with open as f打开方法这种打开文件的方式不用写f.closed关闭文件6.f.encoding取文件打开的编码【推荐阅读】【推荐阅读】示例:......原创 2022-06-28 20:04:25 · 271 阅读 · 0 评论 -
k-means算法可视化
K-Means是一种聚类(Clustering)算法,使用它可以为数据分类。K代表你要把数据分为几个组原创 2022-06-27 22:06:32 · 4482 阅读 · 1 评论 -
【RL】第八章-基于模型的规划与学习-Dyna算法
文章目录8.1 环境的模型8.2 整合了学习与规划的RL学习算法—Dyna算法8.3 基于模拟的搜索8.3.1 简单蒙特卡罗搜索8.3.2 蒙特卡罗树搜索Dyna算法编程8.1 环境的模型8.2 整合了学习与规划的RL学习算法—Dyna算法Dyna 算法从实际经历中学习得到模型,同时联合使用实际经历和基于模型采样得到的虚拟经历来学习和规划,更新价值和 (或) 策略函数基于行为价值的 Dyna-Q 算法的流程如算法 7所述。8.3 基于模拟的搜索在强化学习中,基于模拟的搜索 (simulati原创 2022-02-18 16:42:09 · 1034 阅读 · 0 评论 -
【RL】第七章-DPG基于策略梯度的深度强化学习
文章目录简介基于策略学习的意义策略目标函数演员-评论家算法深度确定性策略梯度(DDPG)编程-DDPG算法的实现简介仅此记录大体框架供自己学习使用,格式因此随意基于策略学习的意义策略目标函数演员-评论家算法深度确定性策略梯度(DDPG)编程-DDPG算法的实现好文章推荐...原创 2022-02-18 14:48:54 · 310 阅读 · 0 评论 -
【RL】基于神经网络(深度学习)的Q学习算法(DQN)
文章目录DQN介绍DDQN介绍编程-基于Pytorch实现DQN求解PuckWorld问题PuckWorld环境介绍:DQN介绍DQN(Deep Q-Learning)是将深度学习与强化学习相结合,当Q-table他过于庞大无法建立的话,使用DQN是一种很好的选择。DQN算法主要使用经历回放(experience replay)(经验池)来实现价值函数的收敛。使用Deep Q-learning方法,从每一episode中得到的奖励来迭代更新Q(s,a). DQN算法中,(具体方法后续更出)继将每一原创 2022-01-28 21:35:25 · 3235 阅读 · 1 评论 -
【DL】Week4-多层神经网络
学习过程中特此记录一下遇到的问题:原创 2021-12-26 10:52:45 · 709 阅读 · 1 评论 -
【RL】MC首次访问和MC每次访问+TD实例(随风行走)
文章目录首次访问蒙特卡洛策略评估每次访问蒙特卡洛策略评估TD实例:MC与TD区别:首次访问蒙特卡洛策略评估每次访问蒙特卡洛策略评估TD实例:#!/usr/bin/env python# -*- encoding: utf-8 -*-'''@File : RandomWork.py@Time : 2021/12/12 16:57:13@Author : zhangzhe @Version : 1.0@Contact : 841121040@原创 2021-12-12 20:54:32 · 1377 阅读 · 0 评论 -
【DL】构建具有单隐藏层的2类分类神经网络-带有一个隐藏层的平面数据分类
文章目录第三周作业 - 带有一个隐藏层的平面数据分类一、加载和查看数据集二、构建神经网络的一般方法是:2.1定义神经网络结构2.2 初始化模型的参数2.3 循环2.3.1 前向传播2.3.2计算损失2.3.3 向后传播2.3.4更新参数整合三、预测正式运行1.更改隐藏层节点数量2.当改变sigmoid激活或ReLU激活的tanh激活时会发生什么?3.改变learning_rate的数值会发生什么4.如果我们改变数据集呢?第三周作业 - 带有一个隐藏层的平面数据分类我们简单说一下我们要做什么。我们要建立一原创 2021-12-06 14:39:47 · 2297 阅读 · 0 评论 -
【DL】搭建一个能够【识别猫】 的简单的神经网络
文章目录一、处理数据集二、构建神经网络三、使用神经网络可视化吴恩达深度学习week2-实战:搭建一个能够【识别猫】** 的简单的神经网络**我们要做的事是搭建一个能够**【识别猫】** 的简单的神经网络h5py文件是存放两类对象的容器,数据集(dataset)和组(group),dataset类似数组类的数据集合,和numpy的数组差不多。group是像文件夹一样的容器,它好比python中的字典,有键(key)和值(value)。group中可以存放dataset或者其他的group。”键”就是组成原创 2021-12-06 14:18:50 · 228 阅读 · 0 评论 -
【RL】Q-learning走迷宫案例及改进
创建迷宫环境import numpy as npimport timeimport sysimport tkinter as tk import randomUNIT = 40 # pixels 像素MAZE_H = 4 # grid height 网格高度MAZE_W = 4 # grid width 网格宽度class Maze(tk.Tk, object): # 继承 def __init__(self): super(Maze, self)..原创 2021-11-23 21:29:56 · 1067 阅读 · 1 评论 -
【RL】迭代法评估4*4方格世界下的随机策略
强化学习实践一 迭代法评估44方格世界下的随机策略本篇用代码演示《强化学习》第三讲中的示例——方格世界,即用动态规划算法通过迭代计算来评估44方格世界中的一个随机策略。#!/usr/bin/env python# -*- encoding: utf-8 -*-'''@File : RL_practice1.py@Time : 2021/11/11 21:30:11@Version : 1.0@Contact : 841121040@qq.com@License原创 2021-11-16 20:02:45 · 251 阅读 · 0 评论 -
pytorch创建一个简单的分类器-OPM内核崩溃
遇到的问题:OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized.OMP: Hint This means that multiple copies of the OpenMP runtime have been linked into the program. That is dangerous, since it can degrade performance or cau原创 2021-11-10 21:05:25 · 232 阅读 · 1 评论 -
【20天吃掉pytorch】day3-bug记录
问题一、将torchtext.data改成torch.legacy.dataTEXT = torchtext.legacy.data.Field(sequential = True ,tokenize = tokenizer,lower =True, fix_length = MAX_LEN,postprocessing = filterLowFreqWords)python - 属性错误 :module 'torchtext.data' has no attribute 'TabularData原创 2021-11-06 13:41:17 · 427 阅读 · 0 评论 -
【20天吃掉pytorch】day2-bug记录
问题一、问题二、input和target的size不匹配解决:自己粗心在组件模型的时候没有return y,所以input和target的size不匹配原创 2021-11-05 14:22:41 · 96 阅读 · 0 评论 -
【RL】异策略算法Q-Learning寻宝藏小例子
介绍例子的环境是一个一维世界, 在世界的右边有宝藏, 探索者只要得到宝藏尝到了甜头, 然后以后就记住了得到宝藏的方法, 这就是他用强化学习所学习到的行为。#先定义qtable 再定义如何去选择行为,再不断地更新#表格是表示寻宝者在每一个位置的选择的概率import numpy as npimport pandas as pdimport timenp.random.seed(2) #产生伪随机数列 每次产生都是一样的 #seed( ) 用于指定随机数生成时所用算法开始的整数值,如果使原创 2021-10-29 10:11:45 · 543 阅读 · 0 评论 -
吴恩达机器学习课后编程作业(Week3)
文章目录*week3 多类分类*week3 多类分类对于此练习,我们将使用逻辑回归来识别手写数字(0到9)。我们将扩展我们在练习2中写的逻辑回归的实现,并将其应用于一对一的分类。 让我们开始加载数据集。它是在MATLAB的本机格式,所以要加载它在Python,我们需要使用一个SciPy工具。#是个十类的问题 import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom scipy.io import lo原创 2021-10-11 08:37:58 · 792 阅读 · 0 评论 -
吴恩达机器学习课后编程作业(Week2)
文章目录逻辑回归+归一化对于画决策边界的问题还有待学习,还没有画出来????♀️????♀️????#!/usr/bin/env python 3.74# -*-coding:utf-8 -*-#@Time: 2021/09/26 13:05:35 #@Author: zz #@File : .py#@Software : VScode#Week2 #1.逻辑回归#建立一个逻辑回归模型来预测一个学生是否被大学录取。#根据两次考试的结果来决定每个申请人的录取机会。有以前的申请人的原创 2021-10-08 20:56:03 · 457 阅读 · 0 评论 -
吴恩达机器学习课后编程作业(Week1)
文章目录单变量线性回归批量梯度下降多变量线性回归正规方程单变量线性回归#线性回归#1.单变量线性回归import numpy as npfrom numpy.lib.shape_base import column_stack #下线性代数工具包import pandas as pd #数据处理工具包import matplotlib.pyplot as plt #画图工具包 path = 'ex1data1.txt'data = pd.read_csv(path, header原创 2021-09-26 12:59:18 · 792 阅读 · 1 评论 -
KNN代码实例
好文转载添加链接描述https://www.cnblogs.com/listenfwind/p/10685192.html转载 2021-09-26 12:56:59 · 71 阅读 · 0 评论