乱七八糟的bug记录

lgbxgb no attribute 'feature_name_' 加个feature_names xg_train=xgb.DMatrix(X_train,label=y_train,feature_names=list(X)) Xgboost出现AttributeError: mod...

2019-03-01 14:41:53

阅读数 36

评论数 0

anaconda 安装后只有Prompt 的问题

之前winpython出问题了,想重装个Anaconda,结果安装后只有Anaconda Prompt 其他四个都没有。 网上看到方法: 1,镜像和官网都试了最新的win版本    ——不行 2,下载了清华镜像一个的指定版本      ——解决了 Anaconda3-4.3.1-Windo...

2019-02-27 16:57:16

阅读数 751

评论数 0

Policy Gradient 策略梯度相关算法

Policy Gradient策略梯度 基本思想 策略梯度算法不采用迂回方式更新策略,而是直接计算策略可能更新的方向。根据策略梯度算法,可以扩展得到actor critic方法。 策略梯度算法推导 TRPO trust region policy ...

2018-12-06 13:04:30

阅读数 293

评论数 0

Deep Reinforcement Learning 文献综述

 转载地址:http://blog.csdn.net/lqfarmer/article/details/72868471 目录 值函数 策略  离散控制 连续控制  多智能体 文本处理 计算机视觉 机器人 游戏 蒙特卡洛 逆强化学习 多任务和迁移学习 搜索优化 层次化...

2018-12-05 21:36:15

阅读数 151

评论数 0

Policy Iteration & Value Iteration

 值迭代的缺点:当多个策略有同样的v(s)的时候,可能无法收敛,循环不会停止。 In Policy Iteration algorithms, you start with a random policy, then find the value function of that pol...

2018-12-05 21:15:12

阅读数 138

评论数 1

DQN玩FlappyBird的核心代码和注释

文章的转载地址 http://lanbing510.info/2018/07/17/DQN.html # File: FlappyBirdDQN.py import cv2 import wrapped_flappy_bird as game from BrainDQN_Nature im...

2018-12-05 12:10:15

阅读数 571

评论数 0

语音识别

原文地址:http://www.voidcn.com/blog/joey_su/article/p-2513632.html 原始语音信号经过A/D转换得到数字信号,经过预加重提升高频成分,接着是加窗,对加窗后的信号进行两个方面的处理,一个方面是提取倒谱特征,即经过离散傅立叶...

2017-01-26 03:52:06

阅读数 408

评论数 0

自动编码器模型和代码解释

CNN算法与程序研究   1)      深度学习基本理论方法 http://wenku.baidu.com/view/2e630ddfc5da50e2524d7ff3   特征多,给出的信息多,识别准确性会提升。 但是,计算复杂度增加,搜索的空间大,可以用来训练的数据在每个特征上就会...

2016-12-07 05:43:12

阅读数 11800

评论数 9

机器学习算法简介和代码(P&R语言)

机器学习算法,P&R语言

2016-12-07 05:33:14

阅读数 679

评论数 0

深度学习资料总结

深度学习总结 1.      MIT在线学习网站 http://www.deeplearningbook.org/   https://www.coursera.org/learn/hipython/supplement/8YtVH/1-1-can-kao-zi-liao 公开课pyth...

2016-12-07 05:13:13

阅读数 2374

评论数 0

DBN深度信念网络数学解析

DBN深度信念网络数学解析

2016-12-06 04:24:09

阅读数 1505

评论数 0

提示
确定要删除当前文章?
取消 删除