weixin_42522567-CSDN博客

原创 tensorflow基础知识-显示张量具体值

代码】tensorflow基础知识。

2022-08-08 22:23:17 502 1

原创机器学习中的训练集、验证集以及测试集

验证集：在训练过程中我们还要对模型选择和参数调优，如果在模型选择的过程中，始终用测试集来评价模型性能进行参数调优，实际上时将测试集变相的转变为训练集。这时候选择的最优模型很可能是过拟合的。所以引入验证集，起作用是在训练过程中进行模型选择和参数调优，减缓训练时的过拟合。测试集：用于评估模型的性能，也可称为模型的泛化能力。测试集从头到尾不参与模型的训练。训练集：用于模型的训练。...

2022-08-08 22:15:49 569

python文件的块是所有行的代码，适用于大型项目，需要从头开始运行python控制台以一行（一般）也可以任意行为块运行它可以显示每个变量属性。不利于代码阅读修改。适用于调试jupyter 以任意行为块运行。利于代码阅读和修改。但是环境需要配置dataset:提供一种方式去获取数据和标签。从垃圾堆中找到有用的可回收垃圾如何获取每个数据和标签以及有多少数据Dataloader: 提供数据打包服务。为后面网络提供不同的数据形式...

2022-07-11 20:57:09 269

原创异构网络-元图、知识图谱

异构网络：异构网络中基于元图的推荐——FMG_cqu_shuai的博客-CSDN博客_元图和元路径异构信息网络和知识图谱异同异质信息网络和知识图谱_饮冰l的博客-CSDN博客_异质信息网络

2022-07-08 21:52:17 435

原创 DDPG简单解释

DDPG是DQN连续动作的扩展版本。DDPG全称Deep Deterministic Policy GradientDeep：使用到了深度神经网络Deterministic: DDPG输出确定性策略，输出Q值最大动作，可以用于连续动作的一个环境Policy Gradient ：使用策略网络进行更新 DDPG需要一边学习Q网络。一边学习策略网络。图示结构称为Actor-Critic结构...

2022-07-07 22:56:02 2072

原创 value-based 与 policy-based区别

value-based 代表算法：sarsa、Q-learning、DQN1、直接输出Q值，根据Q值选择动作2、当把Q网络训练到一定程度后，Q网络收敛，输入相同状态，得到相同动作。属于确定性策略policy-based 算法1、输出每个动作的概率值，然后随机选择动作2、即便把网络训练到收敛，相同状态，也可能得到不同动作，属于随机策略...

2022-07-02 21:00:42 481

原创强化学习&推荐系统入门课程（持续更新）

王树森-深度强化学习课程资料：GitHub - wangshusen/DRL: Deep Reinforcement Learning课程链接：【王树森】深度强化学习(DRL)_哔哩哔哩_bilibili李宏毅-强化学习课程PPT&笔记：Hung-yi LeeEasyRL课程链接：【李宏毅】2020 最新课程 (完整版) 强化学习 - 71.作業十五 ML Lecture 23-1 - Deep Re_哔哩哔哩_bilibili莫凡-强化学习课程代码：https://

2022-05-23 14:36:10 525

原创知识图谱 & 图 & 强化学习 & 推荐系统

知识图谱或图为强化学习的状态和动作选择提供语义信息得到更好的表示来优化强化学习的过程。 Unified Conversational Recommendation Policy Learningvia Graph-based Reinforcement Learning 2021 SIGIR Interactive Recommender System via Knowledge Graph-enhanced Reinforcement Learning 2020 SIGIR Interactive

2022-05-23 10:53:58 820

weixin_42522567的博客

原创 tensorflow基础知识-显示张量具体值

原创机器学习中的训练集、验证集以及测试集

原创 pytorch教程笔记-B站小土堆

原创异构网络-元图、知识图谱

原创 DDPG简单解释

原创 value-based 与 policy-based区别

原创强化学习&推荐系统入门课程（持续更新）

原创知识图谱 & 图 & 强化学习 & 推荐系统

原创强化学习应用到序列推荐与其他推荐输入数据区别

原创科研进阶成长路（关于GPU、CPU区别）

原创 Windows 10系统在Anaconda下安装虚拟环境GPU版Pytorch

空空如也

空空如也